Documentação
O WSTT (Writing System Transformation Tool) é um programa de transcrição e transliteração de sistemas de escrita em páginas WEB. Sua principal finalidade é atuar como uma ferramenta de auxílio no aprendizado de idiomas e alfabetos, através da aplicação de sistemas de escrita estrangeiros em conteúdo publicado na língua ou alfabeto nativos do usuário.
Transcrição, Transliteração e Tradução
Para compreender o funcionamento do WSTT, primeiramente, é necessário estabelecer os conceitos de transcrição, transliteração e tradução. Para tal, podemos utilizar as definições retiradas dos artigos [1], [2], [3]:
Transcrição, é a representação de um sistema de escrita em outro, feita a partir da linguagem falada.
Transliteração, é um mapeamento de um sistema de escrita em outro. Tenta ser sem perdas, isto é, o leitor informado deve poder reconstruir a ortografia original de palavras transliteradas que desconhece. Para conseguí-lo, deve definir convenções complexas sobre como transliterar letras que não têm correspondência direta na escrita de destino. Romaji, por exemplo, é um método de transliteração.
Tradução, é uma atividade que abrange a interpretação do significado de um texto em uma língua - o texto fonte - e a produção de um novo texto em outra língua, mas que exprima o texto original da forma mais exata possível na língua destino; O texto resultante também se chama tradução.
Funcionamento
O WSTT permite transformar os caracteres(letras) de páginas WEB através da aplicação de diferentes métodos de transcrição e transliteração.
O processo de transformação é organizado em "estágios", aplicados progressivamente, onde, para cada um deles, está associado um conjunto específico de caracteres e seus respectivos correspondentes.
Desta forma, o usuário pode controlar a evolução do processo de conversão, permitindo uma assimilação gradual do novo sistema de escrita.
NOTA: As regras de conversão apresentadas neste documento não representam, necessariamente, métodos formais ou oficiais para transcrição e transliteração de sistemas de escrita. Elas são, tão somente, baseadas na observação, avaliação e opinião dos autores deste projeto, tomando como referência publicações já existentes.
O WSTT necessita do Navegador Mozilla Firefox, disponível para download no endereço http://br.mozdev.org/download/.
Após instalar o Firefox, é necessário acessar o arquivo XPI do WSTT e através do link .... e seguir os passos indicados pelo instalador. O acesso deve ser feito utilizando o Firefox.
O método de conversão ativo, a lista de sites aos quais ele se aplica e o nível de conversão podem ser configurados de tela de opções do WSTT, localizado no menu Ferramentas -> Opções do WSTT, ou em Firefox -> Add-ons Manager.
As regras dispostas a seguir não representam qualquer método formal de transcrição estabelecido para representação fonológica do idioma português no alfabeto cirílico. Elas são, tão somente, baseadas na observação, avaliação e opinião dos autores deste projeto.
Estágio (Etapa) |
Caracter(es) Origem Alfabeto Latino - Português Brasileiro |
Caracter(es) Destino Alfabeto Cirílico - Ucraniano |
Comentários |
| 1 |
A |
А (U+0410) |
|
| 1 |
a |
а (U+0430) |
|
| 1 |
Á,À,Â,Ã,Ä |
А (U+0410) |
|
| 1 |
á,à,â,ã,ä |
а (U+0430) |
|
| 1 |
E,É,È,Ê,Ẽ,Ë |
Е (U+0415) |
|
| 1 |
e,é,è,ê,ẽ,ë |
е (U+0435) |
|
| 1 |
I,Í,Ì,Î,Ĩ,Ï |
І (U+0406) |
|
| 1 |
i,í,ì,î,ĩ,ï |
і (U+0456) |
|
| 1 |
O,Ó,Ò,Ô,Õ,Ö |
О (U+041E) |
|
| 1 |
o,ó,ò,ô,õ,ö |
о (U+043E) |
|
| 1 |
U,Ú,Ù,Û,Ũ,Ü |
У (U+0423) |
|
| 1 |
u,ú,ù,û,ũ,ü |
у (U+0443) |
|
| 1 |
W |
W (W) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
w |
w (w) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
X |
X (X) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
x |
x (x) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
Y |
Й (U+0419) |
|
| 1 |
y |
й (U+0439) |
|
| 2 |
B |
Б (U+0411) |
|
| 2 |
b |
б (U+0431) |
|
| 2 |
D |
Д (U+0414) |
|
| 2 |
d |
д (U+0434) |
|
| 2 |
V |
В (U+0412) |
|
| 2 |
v |
в (U+0432) |
|
| 2 |
T |
Т (U+0422) |
|
| 2 |
t |
т (U+0442) |
|
| 3 |
[SX][CcÇç]([EIÉÈÊẼËÍÌÎĨÏeéèêẽëiíìîĩï]) |
С$1 (U+0421$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
[sx][CcÇç]([eiéèêẽëíìîĩïEÉÈÊẼËIÍÌÎĨÏ]) |
с$1 (U+0441$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
C([EIÉÈÊẼËÍÌÎĨÏeéèêẽëiíìîĩï]) |
С$1 (U+0421$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
c([eiéèêẽëíìîĩïEÉÈÊẼËIÍÌÎĨÏ]) |
с$1 (U+0441$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
C |
К (U+041A) |
|
| 3 |
c |
к (U+043A) |
|
| 3 |
F |
Ф (U+0424) |
|
| 3 |
f |
ф (U+0444) |
|
| 3 |
K |
К (U+041A) |
|
| 3 |
k |
к (U+043A) |
|
| 3 |
M |
М (U+041C) |
|
| 3 |
m |
м (U+043C) |
|
| 3 |
M([^\wAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü]) |
Н$1 (U+041D$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
m([^\waáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ]) |
н$1 (U+043D$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
M([\d_\s]) |
Н$1 (U+041D$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
m([\d_\s]) |
н$1 (U+043D$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
M$ |
Н (U+041D) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
m$ |
н (U+043D) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
Q[Uu]([Ee]) |
К$1 (U+041A$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
q[Uu]([Ee]) |
к$1 (U+043A$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 3 |
Q |
К (U+041A) |
|
| 3 |
q |
к (U+043A) |
|
| 4 |
P |
П (U+041F) |
|
| 4 |
p |
п (U+043F) |
|
| 4 |
RR,Rr |
Г (U+0413) |
|
| 4 |
rr,rR |
г (U+0433) |
|
| 4 |
^R([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü]) |
Г$1 (U+0413$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
^r([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü]) |
г$1 (U+0433$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
([\s])R([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü]) |
$1Г$2 ($1U+0413$2) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
([\s])r([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü]) |
$1г$2 ($1U+0433$2) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
R |
Р (U+0420) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
r |
р (U+0440) |
|
| 4 |
([AÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü])S([AÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü]) |
$1З$2 ($1U+0417$2) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
([aáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ])s([aáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ]) |
$1з$2 ($1U+0437$2) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 4 |
Ç,S,SS,Ss |
С (U+0421) |
|
| 4 |
ç,s,ss,sS |
с (U+0441) |
|
| 5 |
H |
Ь (U+042C) |
|
| 5 |
h |
ь (U+044C) |
|
| 5 |
J |
Ж (U+0416) |
|
| 5 |
j |
ж (U+0436) |
|
| 5 |
L |
Л (U+041B) |
|
| 5 |
l |
л (U+043B) |
|
| 6 |
CH,Ch |
Ш (U+0428) |
|
| 6 |
cH,ch |
ш (U+0448) |
|
| 6 |
G[Uu]([Ee]) |
Ґ$1 (U+0490$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
g[Uu]([Ee]) |
ґ$1 (U+0491$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
G |
Ґ (U+0490) |
|
| 6 |
g |
ґ (U+0491) |
|
| 6 |
G([Ee]) |
Ж$1 (U+0416$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
g([Ee]) |
ж$1 (U+0436$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
N |
Н (U+041D) |
|
| 6 |
n |
н (U+043D) |
|
| 6 |
SH,Sh |
Ш (U+0428) |
|
| 6 |
sH,sh |
ш (U+0448) |
|
| 6 |
Z([^\wAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü]) |
С$1 (U+0421$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
z([^\waáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ]) |
с$1 (U+0441$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
Z([\d_\s]) |
С$1 (U+0421$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
z([\d_\s]) |
с$1 (U+0441$1) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
Z$ |
С (U+0421) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
z$ |
с (U+0441) |
A regra de conversão está no formato de Expressão Regular [11]. |
| 6 |
Z |
З (U+0417) |
|
| 6 |
z |
з (U+0437) |
|
Tabela 1. Regras de conversão para transcrição (parcial) entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma português brasileiro, conforme referências [10],[7], [8], [9].
Estágio (Etapa) |
Caracter(es) Origem Alfabeto Latino - Português Brasileiro |
Caracter(es) Destino Alfabeto Cirílico - Ucraniano |
Comentários |
| 1 |
A,Á,À,Â,Ã,Ä |
А (U+0410) |
|
| 1 |
a,á,à,â,ã,ä |
а (U+0430) |
|
| 1 |
E,É,È,Ê,Ẽ,Ë |
Е (U+0415) |
|
| 1 |
e,é,è,ê,ẽ,ë |
е (U+0435) |
|
| 1 |
I,Í,Ì,Î,Ĩ,Ï |
І (U+0406) |
|
| 1 |
i,í,ì,î,ĩ,ï |
і (U+0456) |
|
| 1 |
O,Ó,Ò,Ô,Õ,Ö |
О (U+041E) |
|
| 1 |
o,ó,ò,ô,õ,ö |
о (U+043E) |
|
| 1 |
U,Ú,Ù,Û,Ũ,Ü |
У (U+0423) |
|
| 1 |
u,ú,ù,û,ũ,ü |
у (U+0443) |
|
| 1 |
W |
W (W) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
w |
w (w) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
X |
X (X) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
x |
x (x) |
Não é transformado. Em um método oficial, deve ser. |
| 1 |
Y |
Й (U+0419) |
|
| 1 |
y |
й (U+0439) |
|
| 2 |
B |
Б (U+0411) |
|
| 2 |
b |
б (U+0431) |
|
| 2 |
D |
Д (U+0414) |
|
| 2 |
d |
д (U+0434) |
|
| 2 |
V |
В (U+0412) |
|
| 2 |
v |
в (U+0432) |
|
| 2 |
T |
Т (U+0422) |
|
| 2 |
t |
т (U+0442) |
|
| 3 |
C |
К (U+041A) |
|
| 3 |
c |
к (U+043A) |
|
| 3 |
F |
Ф (U+0424) |
|
| 3 |
f |
ф (U+0444) |
|
| 3 |
K |
К (U+041A) |
|
| 3 |
k |
к (U+043A) |
|
| 3 |
M |
М (U+041C) |
|
| 3 |
m |
м (U+043C) |
|
| 3 |
Q |
К (U+041A) |
|
| 3 |
q |
к (U+043A) |
|
| 4 |
P |
П (U+041F) |
|
| 4 |
p |
п (U+043F) |
|
| 4 |
R |
Р (U+0420) |
|
| 4 |
r |
р (U+0440) |
|
| 4 |
S |
С (U+0421) |
|
| 4 |
s |
с (U+0441) |
|
| 5 |
H |
Г (U+0413) |
|
| 5 |
h |
г (U+0433) |
|
| 5 |
J |
Ж (U+0416) |
|
| 5 |
j |
ж (U+0436) |
|
| 5 |
L |
Л (U+041B) |
|
| 5 |
l |
л (U+043B) |
|
| 6 |
CH,Ch |
Ч (U+0427) |
|
| 6 |
cH,ch |
ч (U+0447) |
|
| 6 |
G |
Ґ (U+0490) |
|
| 6 |
g |
ґ (U+0491) |
|
| 6 |
N |
Н (U+041D) |
|
| 6 |
n |
н (U+043D) |
|
| 6 |
SH,Sh |
Ш (U+0428) |
|
| 6 |
sH,sh |
ш (U+0448) |
|
| 6 |
Z |
З (U+0417) |
|
| 6 |
z |
з (U+0437) |
|
Tabela 2. Regras de conversão para transliteração (parcial) entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma português brasileiro, conforme referências [10],[7], [8], [9].
Estágio (Etapa) |
Caracter(es) Origem Alfabeto Latino - Inglês |
Caracter(es) Destino Alfabeto Cirílico - Ucraniano |
Comentários |
| 1 |
A |
А (U+0410) |
|
| 1 |
a |
а (U+0430) |
|
| 1 |
E |
Е (U+0415) |
|
| 1 |
e |
е (U+0435) |
|
| 1 |
I |
І (U+0406) |
|
| 1 |
i |
і (U+0456) |
|
| 1 |
O |
О (U+041E) |
|
| 1 |
o |
о (U+043E) |
|
| 1 |
U |
У (U+0423) |
|
| 1 |
u |
у (U+0443) |
|
| 1 |
W |
W (W) |
Não é transliterado. Em um método oficial, deve ser. |
| 1 |
w |
w (w) |
Não é transliterado. Em um método oficial, deve ser. |
| 1 |
X |
X (X) |
Não é transliterado. Em um método oficial, deve ser. |
| 1 |
x |
x (x) |
Não é transliterado. Em um método oficial, deve ser. |
| 1 |
Y |
Й (U+0419) |
|
| 1 |
y |
й (U+0439) |
|
| 2 |
B |
Б (U+0411) |
|
| 2 |
b |
б (U+0431) |
|
| 2 |
D |
Д (U+0414) |
|
| 2 |
d |
д (U+0434) |
|
| 2 |
V |
В (U+0412) |
|
| 2 |
v |
в (U+0432) |
|
| 2 |
T |
Т (U+0422) |
|
| 2 |
t |
т (U+0442) |
|
| 3 |
C |
К (U+041A) |
|
| 3 |
c |
к (U+043A) |
|
| 3 |
F |
Ф (U+0424) |
|
| 3 |
f |
ф (U+0444) |
|
| 3 |
K |
К (U+041A) |
|
| 3 |
k |
к (U+043A) |
|
| 3 |
M |
М (U+041C) |
|
| 3 |
m |
м (U+043C) |
|
| 3 |
Q |
К (U+041A) |
|
| 3 |
q |
к (U+043A) |
|
| 4 |
P |
П (U+041F) |
|
| 4 |
p |
п (U+043F) |
|
| 4 |
R |
Р (U+0420) |
|
| 4 |
r |
р (U+0440) |
|
| 4 |
S |
С (U+0421) |
|
| 4 |
s |
с (U+0441) |
|
| 5 |
H |
Г (U+0413) |
|
| 5 |
h |
г (U+0433) |
|
| 5 |
J |
ДЖ (U+0414U+0416) |
|
| 5 |
j |
дж (U+0434U+0436) |
|
| 5 |
L |
Л (U+041B) |
|
| 5 |
l |
л (U+043B) |
|
| 6 |
CH,Ch |
Ч (U+0427) |
|
| 6 |
cH,ch |
ч (U+0447) |
|
| 6 |
G |
Ґ (U+0490) |
|
| 6 |
g |
ґ (U+0491) |
|
| 6 |
N |
Н (U+041D) |
|
| 6 |
n |
н (U+043D) |
|
| 6 |
SH,Sh |
Ш (U+0428) |
|
| 6 |
sH,sh |
ш (U+0448) |
|
| 6 |
Z |
З (U+0417) |
|
| 6 |
z |
з (U+0437) |
|
Tabela 3. Regras de conversão para transliteração entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma inglês, conforme referências [7], [8], [9].
[1] - http://pt.wikipedia.org/wiki/Transcri%C3%A7%C3%A3o
[2] - http://pt.wikipedia.org/wiki/Translitera%C3%A7%C3%A3o
[3] - http://pt.wikipedia.org/wiki/Tradu%C3%A7%C3%A3o
[4] - http://en.wikipedia.org/wiki/Transcription_%28linguistics%29
[5] - http://en.wikipedia.org/wiki/Transliteration
[6] - http://en.wikipedia.org/wiki/Translation
[7] - http://en.wikipedia.org/wiki/Cyrillization
[8] - http://en.wikipedia.org/wiki/Ukrainian_transliteration#Tables_of_romanization_systems
[9] - http://uk.wikipedia.org/wiki/Транслітерація_англійських_слів_кирилицею
[10] - http://pt.wikipedia.org/wiki/Alfabeto_ucraniano
[11] - http://www.regular-expressions.info/
|