dijous, 17 de febrer del 2011

7: Un text xifrat

Problema 7 
La criptografia és la tècnica —o art— de transformar un missatge en un seguit de signes que si són interceptats sigui difícil, o fins i tot impossible, esbrinar el missatge original.
Durant molts segles es van emprar mètodes que amb les tècniques modernes serien molt fàcils de desxifrar. Fins i tot durant la II Guerra Mundial, el mètode de xifratge del Reich alemany que emprava unes màquines anomenades “Enigma” i que només va ser trencat emprant una gran quantitat de mitjans humans i tècnics, seria molt fàcil de trencar amb els ordinadors actuals.
El mètode més antic que es coneix rep el nom de Juli Cèsar, que segurament el va emprar. Consisteix en substituir cada lletra del alfabet  per la lletra que hi ha n posicions més endavant, continuant comptant a partir de la A, si arribem al final del alfabet. Per exemple, si fem servir n = 4, la A es convertirà en E, i la X en B. És un mètode molt fàcil de desxifrar, i si Juli Cèsar el va emprar amb èxit, segurament va ser perquè el seus enemics gairebé no sabien llegir.
Un mètode quasi tan elemental com aquest, és el de substituir cada lletra per un dibuixet diferent. Aquí cal esbrinar a quina lletra correspon cada signe. Recordo haver vist fer servir aquest sistema entre els nois de l’escola…
Si, a més es mantenen els espais entre les paraules o els signes de puntuació, encara és més fàcil ja que paraules d’una o dues lletres n’hi ha poques.
Però aquí, per complicar-ho una mica, farem com Juli Cèsar, que com tots els romans escrivia sense espais; en el text els he suprimit, com també accents i altres signes de puntuació. Els signes estan disposats en grups de cinc, senzillament per llegibilitat.

Text xifrat, sense espais però en grups de 5 caràcters per facilitar la lectura
Podeu desxifrar aquest text? I encara que no tingui res a veure amb la criptografia, esbrinar —és fàcil— qui és el seu autor?

Pistes
En primer lloc, per desxifrar un text d'aquestes característiques, cal fer un estudi estadístic de les freqüències de les lletres.
En català, les 10 lletres més freqüents en un text són per ordre: E, A, S, L, I, R, T, N, O, U. Podem suposar que en el text que volem esbrinar les freqüències seran similars.
En segon lloc les repeticions de lletres. Com que hem suprimit els espais entre paraules, si trobem el mateix símbol dues vegades seguides, pot ser una lletra que es repeteixi dins una paraula, o una que aparegui al final d'un mot i al principi del següent. Si un símbol sure més de dues vegades seguides, és el cas de: ❯❯❯❯, segur que és dos cops al final d'una paraula i una al començament de la següent. En català, això, pràcticament, només li pot passar a una lletra.

Ocurrències dels símbols i de les seves repeticions
 Substituint les símbols més fàcils de conjecturar per la seva lletra, podem començar a esbrinar paraules, que ens donen el valor dels símbols menys freqüents, i amb facilitat ens permetran desxifrar tot el text.

Solució
properament

Cap comentari:

Publica un comentari a l'entrada