Întîlnirea de la sediul IBR
Raport de activitate pentru ziua de 25 noiembrie 2003
Scopul întîlnirii: discuţie cu privire la revizuirea şi promovarea standardului de tastatură românească
Aceasta este a doua întîlnire pe această temă.
Persoanele care au participat la această întîlnire (alfabetic):
- Adrian Stoian (Microsoft România)
- (reprezentant pentru sistemul de operare Microsoft Windows)
- Cristian Secară (B1 TV)
- Dan Matei (cIMeC)
- (preşedintele comitetului tehnic CT 177 - Prelucrarea documentului şi comunicaţii asociate)
- Ioana Vintilă Rădulescu (Academia Română / Institutul de Lingvistică „Iorgu Iordan - Al. Rosetti”)
- Mihaela Anghelescu (ASRO)
- Mihail Popazu (IBM România)
- Mişu Moldovan (Galuna)
- (reprezentant pentru sistemul de operare Linux)
- Natalia Lapteş (IBR)
- Sorin Paliga (Universitatea Bucureşti / Facultatea de limbi şi literaturi străine)
- (reprezentant pentru sistemul de operare Apple Mac OS)
Discuţia a avut ca elemente de referinţă:
S-au trecut în revistă punctele discutate la etapa 2:
- confirmat - conceptul de aranjamente multiple de caractere pentru tastatura limbii române, concept similar cu tastaturile altor limbi
- confirmat - specificarea a două aranjamente distincte de caractere, fiecare urmărind un scop bine definit, scop detaliat la punctele 4.4.1.1. respectiv 4.4.2.1. al documentului de la etapa 1
- confirmat - prezenţa în standard a ghilimelelor româneşti de tip 99 jos / 99 sus (Unicode 201E / 201D)
- (observaţie ulterioară datei întîlnirii)
ghilimelele „ şi ” sunt incluse în codarea de pagină ISO-8859-16, Mac Romanian şi Windows CP-1250, dar nu sunt incluse în codarea ISO-8859-2;
categoriile afectate de această limitare pot fi:
- utilizatorii programelor de e-mail care dintr-un motiv oarecare folosesc codarea de pagină ISO-8859-2
(părere personală: deşi se aplică teoria conform căreia evoluţia programelor de e-mail tinde către suport UTF-8, cel puţin pe termen scurt s-ar putea ca utilizatorii să fie derutaţi de inconsistenţa acestor caractere între mesajele trimise şi cele primite; concluzia ar fi că la acest punct limitarea este destul de importantă; din păcate, [limitarea] trebuie ignorată)
- utilizatorii sistemului de operare Linux şi/sau similare
(părerea domnului Mişu Moldovan: datorită faptului că evoluţia sistemelor de operare tinde către suport Unicode, concluzia ar fi că la acest punct limitarea este puţin importantă)
- confirmat - includerea în standard a caracterului € (Unicode 20AC)
- anulat - standardul nu va include caracterul Non-Breaking Space (Unicode 00A0)
- anulat - standardul nu va include caracterul Non-Breaking Hyphen (Unicode 2011)
- anulat - se revine la includerea în standard a caracterului En-Dash (Unicode 2013)
- cu o modificare - fără caracterul Em-Dash (Unicode 2014)
- anulat - se va permite prezenţa unor aranjamente de caractere alternative, prezente (deja) în cadrul sistemelor de operare, din motive de compatibilitate cu echipamentele hardware aflate (încă) în utilizare
- confirmat - conceptul de a veni în sprijinul particularităţilor lingvistice ale limbii maghiare; se are în vedere situaţia în care un utilizator are de introdus cuvinte de origine maghiară într-un text predominant românesc, nu posibilitatea de a scrie [fluent] exclusiv în limba maghiară
- confirmat - specificaţiile cu privire la dispunerea geometrică a tastelor şi a inscripţionării acestora păstrează modelul SR-ISO/CEI-9995/1997
- cu o modificare - fără caracterul # (Unicode 0023) pe blocul numeric
- anulat - standardul nu se va ocupa de traducerea inscripţionărilor asociate tastelor
Concluziile discuţiei, etapa 4
- Note:
În textul de mai jos se va folosi prescurtarea ÎOOP în locul denumirii complete „Îndreptar Ortografic, Ortoepic şi de Punctuaţie”, editat de Institutul de Lingvistică „Iorgu Iordan - Al. Rosetti” al Academiei Române
În textul de mai jos se va folosi denumirea din limba engleză a caracterelor, aşa cum sunt ele descrise în tabelele de referinţă ale consorţiului Unicode
- s-a decis ca standardul să nu includă caracterul Non-Breaking Space (Unicode 00A0)
Argument:
- datorită imposibilităţii de a face distincţie (vizual) între acest tip de spaţiu şi spaţiul obişnuit, există posibilitatea de confuzie, în special cînd este vorba de căutarea unui şir în baze de date (atît în baze de date externe, cît şi în propriile funcţii de căutare ale programelor)
- s-a decis ca standardul să nu includă caracterul Non-Breaking Hyphen (Unicode 2011)
Argumente:
- acest caracter nu este inclus în nici o codare de pagină pe 8 biţi uzuală, lucru care face dificilă şi/sau imposibilă folosirea lui în texte care folosesc un astfel de tip de codare
- acest caracter lipseşte din majoritatea covîrşitoare a fonturilor; diversele jonglerii tehnice care se fac pentru generarea şi/sau afişarea artificială a acestui caracter sunt implementate haotic, chiar şi în cadrul unor aplicaţii cu pretenţii în privinţa suportului Unicode
- datorită imposibilităţii de a face distincţie (vizual) între acest tip de cratimă (de unire) şi cratima de despărţire, există posibilitatea de confuzie, în special cînd este vorba de căutarea unui şir în baze de date (atît în baze de date externe, cît şi în propriile funcţii de căutare ale programelor)
- s-a decis ca standardul să nu includă caracterul § (Section Sign; Unicode 00A7)
- (observaţie ulterioară datei întîlnirii)
deşi asta poate să nu însemne mare lucru, atrag atenţia asupra faptului că semnul § este folosit intensiv în cadrul ÎOOP, de la pagina 9 pînă la pagina 91
- ar trebui determinat motivul pentru care acest caracter este prezent pe tastaturile altor limbi: engleză internaţional, franceză, germană, maghiară, precum şi pe tastatura românească originală din Windows şi din Mac OS
(pot face o evaluare statistică a prezenţei acestui caracter pe tastaturile limbilor europene, dacă se consideră necesar)
- s-a decis ca standardul să nu includă nici un caracter suplimentar specific domeniului tehnic, de genul µ sau °
- s-a decis ca standardul să nu includă nici un caracter suplimentar „exotic”, de genul © sau ®
- s-a decis ca standardul să includă caracterul – (En-Dash; Unicode 2013)
- acest caracter este descris explicit în ÎOOP la pagina 81
- acest caracter a fost recomandat ca şi prezenţă pe tastatură de către consiliul ştiinţific al Institutului de Lingvistică
- (observaţie ulterioară datei întîlnirii)
caracterul – este inclus în codarea Mac Romanian şi Windows CP-1250, dar nu este inclus nici în codarea ISO-8859-2, nici în codarea ISO-8859-16;
categoriile afectate de această limitare pot fi:
- utilizatorii programelor de e-mail care dintr-un motiv oarecare folosesc codarea de pagină ISO
(părere personală: datorită faptului că (1) evoluţia programelor de e-mail tinde către suport UTF-8 şi (2) mesajele de tip e-mail au un caracter de comunicare directă, foarte puţin literară, concluzia ar fi că la acest punct limitarea este puţin importantă)
- utilizatorii sistemului de operare Linux şi/sau similare
(părerea domnului Mişu Moldovan: datorită faptului că evoluţia sistemelor de operare tinde către suport Unicode, concluzia ar fi că la acest punct limitarea este puţin importantă)
- s-a decis ca standardul să permită compunerea caracterelor cu accent ascuţit (Accute accent; Unicode 00B4)
- generarea accentului se va face folosind nivelul 3 al unei taste, în regim de „tastă moartă”
- pentru limba română, accentul ascuţit este plauzibil a fi folosit în dicţionare, sau în situaţiile în care trebuie precizat senul unui cuvînt
- pentru limba maghiară, acesta este singurul compromis acceptabil pentru a putea genera caracterele limbii maghiare fără a comuta tastatura pe aranjamentul de caractere unguresc
- accentul trebuie să poată fi folosit (cel puţin) de caracterele a, A, e, E, i, I, o, O, u şi U
- deocamdată nu îmi este clar dacă tabelele de referinţă Unicode conţin sau nu caracterele ă, Ă, â, Â, î şi Î cu accent ascuţit
- s-a decis ca standardul să permită compunerea caracterelor cu accent ascuţit dublu (Double accute accent; Unicode 02DD)
- generarea accentului se va face folosind nivelul 3 al unei taste, în regim de „tastă moartă”
- pentru limba maghiară, acesta este singurul compromis acceptabil pentru a putea genera caracterele limbii maghiare fără a comuta tastatura pe aranjamentul de caractere unguresc
- accentul trebuie să poată fi folosit (cel puţin) de caracterele o, O, u şi U
- s-a decis ca standardul să permită compunerea caracterelor cu tremă (Diaeresis; Unicode 00A8)
- generarea accentului se va face folosind nivelul 3 al unei taste, în regim de „tastă moartă”
- pentru limba maghiară, acesta este singurul compromis acceptabil pentru a putea genera caracterele limbii maghiare fără a comuta tastatura pe aranjamentul de caractere unguresc
- accentul trebuie să poată fi folosit (cel puţin) de caracterele a, A, o, O, u şi U
- s-a decis ca tastele alese pentru generarea celor trei accente descrise mai sus să fie:
- tasta
pentru tremă (diaeresis)
- tasta
pentru accentul ascuţit
- tasta
pentru accentul ascuţit dublu
- amplasarea acestor accente pe taste a fost inspirată de aranjamentul de caractere al tastaturii româneşti originale din Windows; diferenţa apare la tremă, care la tastatura românească originală din Windows era pe nivelul 3 al tastei

- amplasarea acestor accente pe tastatură în mod similar cu configuraţia din Mac OS a fost respinsă, în parte, datorită prezenţei semnului € pe tasta pe care – pe tastatura Mac OS – se află accentul ascuţit;
logica amplasării accentelor pe tastatura Mac OS este următoarea:
` pe tasta 
´ pe tasta
; sugerează generarea caracterului é
˝ pe tasta
; sugerează generarea caracterului ű
¨ pe tasta
; sugerează generarea caracterului ï
˜ pe tasta
; sugerează generarea caracterului ñ
datorită limitărilor impuse de codările de pagină pe 8 biţi de tip ISO-8859-2, ISO-8859-16 şi Windows CP-1250, accentele ` (Grave accent; Unicode 0060) şi ~ (Tilde; Unicode 007E) nu pot fi folosite pentru generarea de caractere compuse [cu aceste accente] atunci cînd se foloseşte tastatura românească;
din acelaşi motiv, accentul ¨ nu poate fi folosit pentru generarea caracterului ï atunci cînd se foloseşte tastatura românească
- s-a decis ca din aranjamentul 2 să se excludă dualitatea prezenţei caracterelor româneşti cu diacritice; poziţionările care rămîn sunt cele inspirate din cultura Linux, respectiv
AltGr+a=ă, AltGr+q=â, AltGr+i=î, AltGr+s=ş, AltGr+t=ţ
şi
Shift+AltGr+a=Ă, Shift+AltGr+q=Â, Shift+AltGr+i=Î, Shift+AltGr+s=Ş, Shift+AltGr+t=Ţ
- s-a decis ca semnul € (Euro sign; Unicode 20AC) să fie prezent exclusiv pe nivelul trei al tastei

- (observaţie ulterioară datei întîlnirii)
pentru aranjamentul 1, amplasarea semnului € exclusiv pe nivelul trei al tastei E este justificată;
pentru aranjamentul 2, acest lucru s-ar putea să nu fie suficient; conform definiţiei enunţate la punctul 4.4.2.1. al documentului de la etapa 1, scopul aranjamentului 2 este „[...] să permită utilizatorilor să folosească tastatura pentru a scrie în limba engleză [...]; avînd în vedere că o parte a tastaturilor comercializate în România sunt de tipul US English International, care au desenat semnul € pe nivelul trei al tastei 5, s-ar putea să fie necesar ca – cel puţin pentru aranjamentul 2 – caracterul € să poată fi generat şi prin folosirea combinaţiei AltGr+5
(părere personală: ar fi de preferat să existe o coerenţă între cele două aranjamente de caractere, adică indiferent unde se va decide amplasarea acestui caracter, el să poată fi găsit în acelaşi loc)
- s-a propus ca aranjamentul 1 să poarte denumirea de
Română (prescurtat RO) acolo unde meniurile folosesc limba română, sau
Romanian (prescurtat RO) acolo unde meniurile folosesc limba engleză;
acesta este aranjamentul principal;
acesta este aranjamentul care va fi folosit pentru inscripţionarea tastaturilor comercializate
- s-a propus ca aranjamentul 2 să poarte denumirea de Română (aranjament US) (prescurtat RO-US) acolo unde meniurile folosesc limba română, sau
Romanian (US layout) (prescurtat RO-US) acolo unde meniurile folosesc limba engleză
La finalul discuţiei s-a schiţat o planificare a activităţii viitoare:
- s-a propus ca standardul revizuit să fie disponibil pe internet, în versiune de ciornă, în cadrul acestui sit, pe toată perioada lunii ianuarie
- s-a propus mediatizarea acestei acţiuni
- s-a propus ca următoarea întîlnire să aibă loc la sfîrşitul lunii ianuarie 2004
- s-a propus ca finalizarea acestei acţiuni să aibă loc în luna februarie 2004
Conform celor descrise pînă acum, configuraţia tastaturii devine:
- pentru aranjamentul 1 al caracterelor pe tastatură
- pentru aranjamentul 2 al caracterelor pe tastatură
[Sus de tot]
Last updated 31 July, 2016
© 1999-2016 Cristian Secară