Documentação


Introdução

O WSTT (Writing System Transformation Tool) é um programa de transcrição e transliteração de sistemas de escrita em páginas WEB. Sua principal finalidade é atuar como uma ferramenta de auxílio no aprendizado de idiomas e alfabetos, através da aplicação de sistemas de escrita estrangeiros em conteúdo publicado na língua ou alfabeto nativos do usuário.

Transcrição, Transliteração e Tradução


Para compreender o funcionamento do WSTT, primeiramente, é necessário estabelecer os conceitos de transcrição, transliteração e tradução. Para tal, podemos utilizar as definições retiradas dos artigos [1],[2],[3]:

Transcrição, é a representação de um sistema de escrita em outro, feita a partir da linguagem falada.

Transliteração, é um mapeamento de um sistema de escrita em outro. Tenta ser sem perdas, isto é, o leitor informado deve poder reconstruir a ortografia original de palavras transliteradas que desconhece. Para conseguí-lo, deve definir convenções complexas sobre como transliterar letras que não têm correspondência direta na escrita de destino. Romaji, por exemplo, é um método de transliteração.

Tradução, é uma atividade que abrange a interpretação do significado de um texto em uma língua - o texto fonte - e a produção de um novo texto em outra língua, mas que exprima o texto original da forma mais exata possível na língua destino; O texto resultante também se chama tradução.

Funcionamento


O WSTT permite transformar os caracteres(letras) de páginas WEB através da aplicação de diferentes métodos de transcrição e transliteração.
O processo de transformação é organizado em "estágios", aplicados progressivamente, onde, para cada um deles, está associado um conjunto específico de caracteres e seus respectivos correspondentes.
Desta forma, o usuário pode controlar a evolução do processo de conversão, permitindo uma assimilação gradual do novo sistema de escrita.

NOTA: As regras de conversão apresentadas neste documento não representam, necessariamente, métodos formais ou oficiais para transcrição e transliteração de sistemas de escrita. Elas são, tão somente, baseadas na observação, avaliação e opinião dos autores deste projeto, tomando como referência publicações já existentes.


Instalação

O WSTT necessita do Navegador Mozilla Firefox, disponível para download no endereço http://br.mozdev.org/download/.
Após instalar o Firefox, é necessário acessar o arquivo XPI do WSTT e através do link .... e seguir os passos indicados pelo instalador. O acesso deve ser feito utilizando o Firefox.


Configuração

O método de conversão ativo, a lista de sites aos quais ele se aplica e o nível de conversão podem ser configurados de tela de opções do WSTT, localizado no menu Ferramentas -> Opções do WSTT, ou em Firefox -> Add-ons Manager.


Transcrição (WSTT) / Português Brasileiro / Alfabeto Latino -> Cirílico Ucraniano

As regras dispostas a seguir não representam qualquer método formal de transcrição estabelecido para representação fonológica do idioma português no alfabeto cirílico. Elas são, tão somente, baseadas na observação, avaliação e opinião dos autores deste projeto.

Estágio
(Etapa)
Caracter(es) Origem
Alfabeto Latino - Português Brasileiro
Caracter(es) Destino
Alfabeto Cirílico - Ucraniano
Comentários
1
A
А (U+0410)
1
a
а (U+0430)
1
Á,À,Â,Ã,Ä
А (U+0410)
1
á,à,â,ã,ä
а (U+0430)
1
E,É,È,Ê,Ẽ,Ë
Е (U+0415)
1
e,é,è,ê,ẽ,ë
е (U+0435)
1
I,Í,Ì,Î,Ĩ,Ï
І (U+0406)
1
i,í,ì,î,ĩ,ï
і (U+0456)
1
O,Ó,Ò,Ô,Õ,Ö
О (U+041E)
1
o,ó,ò,ô,õ,ö
о (U+043E)
1
U,Ú,Ù,Û,Ũ,Ü
У (U+0423)
1
u,ú,ù,û,ũ,ü
у (U+0443)
1
W
W (W) Não é transformado. Em um método oficial, deve ser.
1
w
w (w) Não é transformado. Em um método oficial, deve ser.
1
X
X (X) Não é transformado. Em um método oficial, deve ser.
1
x
x (x) Não é transformado. Em um método oficial, deve ser.
1
Y
Й (U+0419)
1
y
й (U+0439)
2
B
Б (U+0411)
2
b
б (U+0431)
2
D
Д (U+0414)
2
d
д (U+0434)
2
V
В (U+0412)
2
v
в (U+0432)
2
T
Т (U+0422)
2
t
т (U+0442)
3
[SX][CcÇç]([EIÉÈÊẼËÍÌÎĨÏeéèêẽëiíìîĩï])
С$1 (U+0421$1) A regra de conversão está no formato de Expressão Regular [11].
3
[sx][CcÇç]([eiéèêẽëíìîĩïEÉÈÊẼËIÍÌÎĨÏ])
с$1 (U+0441$1) A regra de conversão está no formato de Expressão Regular [11].
3
C([EIÉÈÊẼËÍÌÎĨÏeéèêẽëiíìîĩï])
С$1 (U+0421$1) A regra de conversão está no formato de Expressão Regular [11].
3
c([eiéèêẽëíìîĩïEÉÈÊẼËIÍÌÎĨÏ])
с$1 (U+0441$1) A regra de conversão está no formato de Expressão Regular [11].
3
C
К (U+041A)
3
c
к (U+043A)
3
F
Ф (U+0424)
3
f
ф (U+0444)
3
K
К (U+041A)
3
k
к (U+043A)
3
M
М (U+041C)
3
m
м (U+043C)
3
M([^\wAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü])
Н$1 (U+041D$1) A regra de conversão está no formato de Expressão Regular [11].
3
m([^\waáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ])
н$1 (U+043D$1) A regra de conversão está no formato de Expressão Regular [11].
3
M([\d_\s])
Н$1 (U+041D$1) A regra de conversão está no formato de Expressão Regular [11].
3
m([\d_\s])
н$1 (U+043D$1) A regra de conversão está no formato de Expressão Regular [11].
3
M$
Н (U+041D) A regra de conversão está no formato de Expressão Regular [11].
3
m$
н (U+043D) A regra de conversão está no formato de Expressão Regular [11].
3
Q[Uu]([Ee])
К$1 (U+041A$1) A regra de conversão está no formato de Expressão Regular [11].
3
q[Uu]([Ee])
к$1 (U+043A$1) A regra de conversão está no formato de Expressão Regular [11].
3
Q
К (U+041A)
3
q
к (U+043A)
4
P
П (U+041F)
4
p
п (U+043F)
4
RR,Rr
Г (U+0413)
4
rr,rR
г (U+0433)
4
^R([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü])
Г$1 (U+0413$1) A regra de conversão está no formato de Expressão Regular [11].
4
^r([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü])
г$1 (U+0433$1) A regra de conversão está no formato de Expressão Regular [11].
4
([\s])R([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü])
$1Г$2 ($1U+0413$2) A regra de conversão está no formato de Expressão Regular [11].
4
([\s])r([AaEeIiOoUuÁÀÂÃÄÉÈÊẼËÍÌÎĨÏÓÒÔÕÖÚÙÛŨÜáàâãäéèêẽëíìîĩïóòôõöúùûũü])
$1г$2 ($1U+0433$2) A regra de conversão está no formato de Expressão Regular [11].
4
R
Р (U+0420) A regra de conversão está no formato de Expressão Regular [11].
4
r
р (U+0440)
4
([AÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü])S([AÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü])
$1З$2 ($1U+0417$2) A regra de conversão está no formato de Expressão Regular [11].
4
([aáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ])s([aáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ])
$1з$2 ($1U+0437$2) A regra de conversão está no formato de Expressão Regular [11].
4
Ç,S,SS,Ss
С (U+0421)
4
ç,s,ss,sS
с (U+0441)
5
H
Ь (U+042C)
5
h
ь (U+044C)
5
J
Ж (U+0416)
5
j
ж (U+0436)
5
L
Л (U+041B)
5
l
л (U+043B)
6
CH,Ch
Ш (U+0428)
6
cH,ch
ш (U+0448)
6
G[Uu]([Ee])
Ґ$1 (U+0490$1) A regra de conversão está no formato de Expressão Regular [11].
6
g[Uu]([Ee])
ґ$1 (U+0491$1) A regra de conversão está no formato de Expressão Regular [11].
6
G
Ґ (U+0490)
6
g
ґ (U+0491)
6
G([Ee])
Ж$1 (U+0416$1) A regra de conversão está no formato de Expressão Regular [11].
6
g([Ee])
ж$1 (U+0436$1) A regra de conversão está no formato de Expressão Regular [11].
6
N
Н (U+041D)
6
n
н (U+043D)
6
SH,Sh
Ш (U+0428)
6
sH,sh
ш (U+0448)
6
Z([^\wAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜaáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũü])
С$1 (U+0421$1) A regra de conversão está no formato de Expressão Regular [11].
6
z([^\waáàâãäeéèêẽëiíìîĩïoóòôõöuúùûũüAÁÀÂÃÄEÉÈÊẼËIÍÌÎĨÏOÓÒÔÕÖUÚÙÛŨÜ])
с$1 (U+0441$1) A regra de conversão está no formato de Expressão Regular [11].
6
Z([\d_\s])
С$1 (U+0421$1) A regra de conversão está no formato de Expressão Regular [11].
6
z([\d_\s])
с$1 (U+0441$1) A regra de conversão está no formato de Expressão Regular [11].
6
Z$
С (U+0421) A regra de conversão está no formato de Expressão Regular [11].
6
z$
с (U+0441) A regra de conversão está no formato de Expressão Regular [11].
6
Z
З (U+0417)
6
z
з (U+0437)
Tabela 1. Regras de conversão para transcrição (parcial) entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma português brasileiro, conforme referências [10],[7], [8], [9].


Transliteração / Português Brasileiro / Alfabeto Latino -> Cirílico Ucraniano

Estágio
(Etapa)
Caracter(es) Origem
Alfabeto Latino - Português Brasileiro
Caracter(es) Destino
Alfabeto Cirílico - Ucraniano
Comentários
1 A,Á,À,Â,Ã,Ä А (U+0410)
1 a,á,à,â,ã,ä а (U+0430)
1 E,É,È,Ê,Ẽ,Ë Е (U+0415)
1 e,é,è,ê,ẽ,ë е (U+0435)
1 I,Í,Ì,Î,Ĩ,Ï І (U+0406)
1 i,í,ì,î,ĩ,ï і (U+0456)
1 O,Ó,Ò,Ô,Õ,Ö О (U+041E)
1 o,ó,ò,ô,õ,ö о (U+043E)
1 U,Ú,Ù,Û,Ũ,Ü У (U+0423)
1 u,ú,ù,û,ũ,ü у (U+0443)
1 W W (W) Não é transformado. Em um método oficial, deve ser.
1 w w (w) Não é transformado. Em um método oficial, deve ser.
1 X X (X) Não é transformado. Em um método oficial, deve ser.
1 x x (x) Não é transformado. Em um método oficial, deve ser.
1 Y Й (U+0419)
1 y й (U+0439)
2 B Б (U+0411)
2 b б (U+0431)
2 D Д (U+0414)
2 d д (U+0434)
2 V В (U+0412)
2 v в (U+0432)
2 T Т (U+0422)
2 t т (U+0442)
3 C К (U+041A)
3 c к (U+043A)
3 F Ф (U+0424)
3 f ф (U+0444)
3 K К (U+041A)
3 k к (U+043A)
3 M М (U+041C)
3 m м (U+043C)
3 Q К (U+041A)
3 q к (U+043A)
4 P П (U+041F)
4 p п (U+043F)
4 R Р (U+0420)
4 r р (U+0440)
4 S С (U+0421)
4 s с (U+0441)
5 H Г (U+0413)
5 h г (U+0433)
5 J Ж (U+0416)
5 j ж (U+0436)
5 L Л (U+041B)
5 l л (U+043B)
6 CH,Ch Ч (U+0427)
6 cH,ch ч (U+0447)
6 G Ґ (U+0490)
6 g ґ (U+0491)
6 N Н (U+041D)
6 n н (U+043D)
6 SH,Sh Ш (U+0428)
6 sH,sh ш (U+0448)
6 Z З (U+0417)
6 z з (U+0437)
Tabela 2. Regras de conversão para transliteração (parcial) entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma português brasileiro, conforme referências [10],[7], [8], [9].


Transliteration / English / Latin Alphabet -> Ukrainian Cyrillic

Estágio
(Etapa)
Caracter(es) Origem
Alfabeto Latino - Inglês
Caracter(es) Destino
Alfabeto Cirílico - Ucraniano
Comentários
1 A А (U+0410)
1 a а (U+0430)
1 E Е (U+0415)
1 e е (U+0435)
1 I І (U+0406)
1 i і (U+0456)
1 O О (U+041E)
1 o о (U+043E)
1 U У (U+0423)
1 u у (U+0443)
1 W W (W) Não é transliterado. Em um método oficial, deve ser.
1 w w (w) Não é transliterado. Em um método oficial, deve ser.
1 X X (X) Não é transliterado. Em um método oficial, deve ser.
1 x x (x) Não é transliterado. Em um método oficial, deve ser.
1 Y Й (U+0419)
1 y й (U+0439)
2 B Б (U+0411)
2 b б (U+0431)
2 D Д (U+0414)
2 d д (U+0434)
2 V В (U+0412)
2 v в (U+0432)
2 T Т (U+0422)
2 t т (U+0442)
3 C К (U+041A)
3 c к (U+043A)
3 F Ф (U+0424)
3 f ф (U+0444)
3 K К (U+041A)
3 k к (U+043A)
3 M М (U+041C)
3 m м (U+043C)
3 Q К (U+041A)
3 q к (U+043A)
4 P П (U+041F)
4 p п (U+043F)
4 R Р (U+0420)
4 r р (U+0440)
4 S С (U+0421)
4 s с (U+0441)
5 H Г (U+0413)
5 h г (U+0433)
5 J ДЖ (U+0414U+0416)
5 j дж (U+0434U+0436)
5 L Л (U+041B)
5 l л (U+043B)
6 CH,Ch Ч (U+0427)
6 cH,ch ч (U+0447)
6 G Ґ (U+0490)
6 g ґ (U+0491)
6 N Н (U+041D)
6 n н (U+043D)
6 SH,Sh Ш (U+0428)
6 sH,sh ш (U+0448)
6 Z З (U+0417)
6 z з (U+0437)
Tabela 3. Regras de conversão para transliteração entre os alfabetos latino (origem) e cirílico (destino), em palavras do idioma inglês, conforme referências [7], [8], [9].


Referências

[1] - http://pt.wikipedia.org/wiki/Transcri%C3%A7%C3%A3o
[2] - http://pt.wikipedia.org/wiki/Translitera%C3%A7%C3%A3o
[3] - http://pt.wikipedia.org/wiki/Tradu%C3%A7%C3%A3o
[4] - http://en.wikipedia.org/wiki/Transcription_%28linguistics%29
[5] - http://en.wikipedia.org/wiki/Transliteration
[6] - http://en.wikipedia.org/wiki/Translation
[7] - http://en.wikipedia.org/wiki/Cyrillization
[8] - http://en.wikipedia.org/wiki/Ukrainian_transliteration#Tables_of_romanization_systems
[9] - http://uk.wikipedia.org/wiki/Транслітерація_англійських_слів_кирилицею
[10] - http://pt.wikipedia.org/wiki/Alfabeto_ucraniano
[11] - http://www.regular-expressions.info/

Copyright 2006-2013 WS/Tech² Informática LTDA - ME. Todos os Direitos Reservados.
Contato: / Curitiba - PR