RO e-mail

Ați instalat și configurat tot ce trebuie – sistem, tastatură. Vă pregătiți să trimiteți un mesaj și vă propuneți să-l scrieți în română.
Sunteți sigur că mesajul va fi reprodus corect la destinație ?

    Note:
    În cele ce urmează, prin „a scrie în română” se subînțelege un text sau fragment de text care folosește diacritice.
    Se are în vedere schimbul de informație prin intermediul textelor de e-mail, dar cele descrise mai jos sunt aplicabile și pentru crearea paginilor de internet.

Problemele pot fi diferite atunci cînd:


(i) Vreți să compuneți un text destinat altcuiva

Practica arată că varza cea mai des întîlnită este în privința mesajelor de e‑mail.
Deși soluțiile sunt relativ simple, în mod misterios ceva merge împiedicat.

În cazul compunerii unui mesaj cu Mozilla -> View -> Character Coding -> (se deschide această listă)
exemplu de selectare a codării mesajului (mailerul Mozilla)

Este de reținut că în general limba engleză americană este clasificată ca „US-ASCII” sau „Western”, iar limba română ca „Central European”.

Cazul fericit este cînd sistemul a fost configurat corect (cu setările de localizare pe română), iar programul de e-mail ține cont de ele.
Cazul nefericit este cînd nimeni nu s-a obosit să configureze ceva, iar programul de e-mail lucrează de capul lui. În acest ultim caz specificarea codării trebuie verificată și eventual corectată manual.

Unde trebuie umblat la cîteva dintre programele de e-mail uzuale:
Outlook Express sau Outlook: în meniul ferestrei de compunere a mesajului -> clic pe Format -> Codificare -> se alege din lista desfășurată una dintre codările descrise aici mai jos (la Outlook, în caz că este selectat „Automatic”, este de preferat să fie lăsat așa)
Mozilla Thunderbird: în meniul ferestrei de compunere a mesajului -> clic pe Opțiuni -> Codare caractere -> se alege din lista desfășurată una dintre codările descrise aici mai jos
Ximian Evolution: în meniul ferestrei de compunere a mesajului -> clic pe Editare -> Codare caractere -> se alege din lista desfășurată una dintre codările descrise aici mai jos

Ce se poate alege în listele exemplificate mai sus:

  • codarea standardizată UTF-8
  • codarea standardizată ISO/IEC-8859-2 (Latin 2)
  • codarea standardizată ISO/IEC-8859-16 (Latin 10)
  • codarea proprietară Windows CP-1250 (Windows Central European).
  • Notă: mai există codarea proprietară MacRomanian, provenită de la sistemele Apple MacOS de generație mai veche, dar în anul 2010 deja se poate uita de ea; pe platforma Apple MacOS este o codare perimată, iar pe platforme non-Apple este o codare practic nesuportată

Pro și contra:

codarea UTF-8

  • avantaj
    • se poate scrie, transmite și citi orice caracter imaginabil, în orice limbă (afirmația este valabilă cu condiția să existe și un font care să conțină glifa respectivă, în caz contrar textul fiind afișat cu găuri din loc în loc)
  • dezavantaj
    • în anul 2010 deja nu mai există niciunul; lipsa acestui tip de codare ține de-acum mai degrabă doar de proasta configurare a sistemelor sau a aplicațiilor decât de incapacitatea acestora de a gestiona acest tip de codare

codarea ISO/IEC-8859-2

  • avantaj
    • recunoscută de orice program de e-mail decent, indiferent de platforma pe care rulează
  • dezavantaj
    • în anul 2010 este deja o codare anacronică
    • lipsesc caracterle ș și ț cu virgulă (vedeți aici detalii pe această temă)
    • lipsesc ghilimelele românești și , cele alternative « și », precum și simbolul (Euro)

codarea ISO/IEC-8859-16

  • avantaj
    • prezintă o îmbunătățire lingvistică a codării ISO/IEC-8859-2; setul de caractere extins conține practic toate caracterle utile limbii române (cu excepția caracterului (liniuță de dialog / pauză orizontală (denumită uneori și pauză albă); Unicode 2013)
  • dezavantaj
    • în anul 2010 este deja o codare anacronică, datorită trecerii pe linie moartă a codărilor pe 8 biți
    • fiind apărută relativ tîrziu, nu toate sistemele recunosc acest tip de codare; un caz notabil este sistemul de operare Microsoft Windows (a se vedea aici detalii pe această temă)

codarea Windows CP-1250 (Windows Central European)

  • avantaj
    • -
  • dezavantaj
    • în anul 2010 este deja o codare anacronică, datorită trecerii pe linie moartă a codărilor pe 8 biți
    • fiind un sistem de codare proprietar, este recunoscut cu ușurință doar de aplicațiile create de Microsoft; aplicațiile alternative, indiferent de platforma pe care rulează, nu se simt obligate să suporte acest tip de codare
    • se poate întîmpla ca în cazul sistemelor de operare alternative, altele decît Windows, suportul pentru acest tip de codare să existe ca principiu dar să nu fi fost instalat (depinde în mare măsură de cel care a instalat și/sau configurat sistemul)


Ca o concluzie: nu folosiți alt tip de codare în afara celor descrise mai sus atunci cînd scrieți un mesaj de e-mail în limba română !
Același lucru este valabil și pentru crearea paginilor de internet.


(ii) Vreți să citiți un text primit de la altcineva

În mod normal, în momentul trimiterii unui mesaj de e-mail, programul include o informație suplimentară sub forma unei linii de text în antetulul mesajului. Linia conține (și) informația despre cum a fost codat textul:
Content-Type: text/plain; charset="UTF-8"
În exemplul arătat codarea este de tip UTF-8, dar în practică poate fi alta în funcție de alegerea celui care a trimis mesajul / cum a fost configurat sistemul sau programul de e-mail / pur și simplu cum s-a nimerit să fie.

Programul de e-mail care primește mesajul știe să interpreteze informația din acea linie și decodează textul în mod corespunzător.

Există însă cazuri în care cel care trimite mesajul a ales greșit codarea paginii, sau n-a ales nimic și era greșită fără ca el să știe. Mai rar, informația despre codare lipsește pur și simplu.
Cea mai des întîlnită greșeală este de tipul: mesaj care conține un text scris în limba română, dar la care codarea a rămas pe engleză americană (US-ASCII, eventual ISO-8859-1 sau Windows CP-1252). Într-un astfel de caz, la citire, datorită înlocuirii anumitor caractere românești, mesajul poate să devină greu sau imposibil de citit.
Până prin anul 2007, un mesaj trimis de pe Yahoo se încadra în această situație, azi însă au trecut și ei (în sfârșit) la UTF-8.

Soluția în situația primirii unui astfel de mesaj este relativ simplă: forțarea de către utilizator (cel care citește mesajul) a afișării într-un cod de pagină compatibil cu limba română.
Singura problemă este că trebuie mers pe ghicite.

 

exemplul 1:
un mesaj trimis de pe Yahoo

uitându-se pe ecran, cel care scrie mesajul este convins că scrie corect în limba română, dar de fapt asta este ceeace vede destinatarul

lipsa caracterelor ş şi ţ cu virgulă din aproape toate fonturile livrate de Microsoft

 

exemplul 2:
același mesaj la care cel care citește mesajul forțează din meniu o codare compatibilă cu limba română

programul de e-mail este Outlook Express, codarea aleasă este Central European (Windows CP-1250)

lipsa caracterelor ş şi ţ cu virgulă din aproape toate fonturile livrate de Microsoft

Se pot încerca următoarele variante:

forțarea codarării Windows CP-1250 (Windows Central European)
De ce asta și nu alta: pentru că sunt șanse ca mesajul să fi fost creat cu ajutorul unei interfețe de tip web-mail (genul Yahoo), folosind, să zicem, programul Internet Explorer, pe un calculator pe care era instalat sistemul de operare Microsoft Windows. În acest caz este posibil ca aplicația folosită la crearea și trimiterea mesajului să fi folosit o codare nativă Windows.

forțarea codarării ISO/IEC-8859-2
De ce asta și nu alta: pentru că sunt șanse ca mesajul să fi fost creat cu ajutorul unei interfețe de tip web-mail (genul Yahoo), folosind, să zicem, programul Mozilla Firefox, pe un calculator pe care era instalat sistemul de operare Linux. În acest caz este posibil ca aplicația folosită la crearea și trimiterea mesajului să fi folosit o codare de tip ISO.

    Notă: strict din punctul de vedere al diacriticelor românești suportate (ă â și î și majusculele Ă Â și Î asociate) nu este nicio diferență între codările Windows CP-1250 și ISO-8859-2; diferențele apar la alte caractere, cum ar fi de exemplu la ghilimelele românești „ și ” sau la simbolul € (Euro)

un mesaj codat UTF-8, la a cărui afișare s-a folosit o codare greșită

forțarea codarării UTF-8
De ce asta și nu alta: doar în situația în care mesajul vă apare afișat cam cum se vede în imaginea alăturată:

 

forțarea codarării ISO/IEC-8859-16 (acolo unde aplicația are această opțiune)
De ce asta și nu alta: sincer să fiu nu prea aveți nici un motiv, deoarece șansele ca mesajul să fi fost creat folosindu-se acest tip de codare sunt nule :)

    Notă: în cazul citirii mesajelor scrise în română cu ajutorul unei interfețe de tip „webmail” (genul Yahoo), forțarea codării se poate efectua din meniul browserului folosit, într-un mod similar cu cel descris la programele de e-mail


Ca o concluzie: dacă mesajul primit vă apare afișat aiurea, încercați la nimereală pentru că aveți șanse ca pînă la urmă să vedeți corect respectivul mesaj !

[Sus de tot]
 

[Home] [RO] [Gallery] [ZX Zone] [Who, Me ?]

Last updated 21.06.2010 (What’s new ?)
© 1999-2010 Cristian Secară