Internalisasyon, Lokalisasyon, Pag-encode, Iceland at Pagsasalin ng isang Japanese Cat Photo Website

pagsasalin internationalization

internationalizationMayroong maraming impormasyon doon tungkol sa internationalization, localization at encoding sa loob ng mga web application. Mayroon ding maraming hindi pagkakaunawaan tungkol sa kung ano ang ibinibigay ng bawat isa para sa isang web application. Narito ang aking kunin ...

Kapag ang isang web browser ay gumawa ng isang koneksyon sa isang web server, ipinapasa nito ang ilang mga variable at gumagawa ng karagdagang mga kahilingan, narito ang isang halimbawa:

GET / HTTP / 1.1
Host: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Tanggapin: HTTP Tanggapin = teksto / xml, application / xml, application / xhtml + xml, teksto / html; q = 0.9, teksto / payak; q = 0.8, imahe / png, * / *; q = 0.5
Tanggapin-Wika: en-us, en; q = 0.5
Tanggapin-Encoding: gzip, pagpapaliit
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

internationalization

Ang internalisasyon ay isang pinaghalo ng maraming mga bagay:

  1. Lokalisasyon: Ang kakayahang kilalanin kung anong wika at lokasyon ang binibisita ng isang bisita. Ginagawa ito sa pamamagitan ng Mga Kahilingan sa HTTP kung saan ang bisita ay kinilala ng isang lokal. Sa aking kaso, iyon ay en-US. Ang "en" ay Ingles at ang "US" ay ang Estados Unidos. Ito ay isang setting sa loob ng aking Operating System.
  2. Mga time zone: Ang kakayahang ayusin para sa mga time zone. Karaniwan itong nagagawa sa pamamagitan ng pagtatakda ng iyong server sa isang Greenwich Mean Time (GMT) at pagkatapos ay pahintulutan ang mga gumagamit na itakda ang kanilang lokal na offset mula sa GMT.
  3. Character encoding: Ito ang kakayahang ipakita nang maayos ang mga setting ng character ng wika. Ito ay naiiba mula sa lokalisasyon dahil maaaring sabihin sa akin ng localization ang wika at rehiyon ng computer kung saan humihiling ang kahilingan, ngunit hindi nito sasabihin sa akin kung anong wika ang mambabasa ay humihiling ... nasa sa mambabasa iyon!

Pansinin sa aking HTTP Header nang maghanap ang browser, sinabi nito sa server na humihiling ito sa aking lokal (Accept-Language: en-us); gayunpaman, kailangan din nitong sabihin sa server kung ano ang hiniling na itinakda ng Character (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 at utf -8 ay kapwa pinapayagan na mga set ng character.

Lokalisasyon

Sa kamangha-manghang mundo ng halo-halong ito, ang lokalisasyon ay hindi na nagdidikta ng wika. Kahit na nasa en-US ako, lubos kong mababasa ang ibang wika gamit ang ibang hanay ng character ... iyon ang nangyayari kapag ginamit ko Google Hindi (Hindi ko talaga ginagamit ang Google Hindi). Ang aking hiling para sa lokal at hanay ng character ay magkapareho tulad ng kapag hiniling ko ang Google English pahina, ngunit talagang pinakain ko ang isang pahina na hindi ko mabasa dahil wala akong itinakdang character. Ang lahat ay darating ?????? ... Gayunpaman, maaari kong mai-load ang character na iyon na itinakda sa Firefox (Firefox> Mga Kagustuhan> Advanced> Mga Wika):

Wika ng Load ng Firefox

Kung na-load ko ang wikang iyon, maaari akong humiling ng pahina sa sarili nitong hanay ng character at ipakita ito sa aking computer kahit na ang aking default na lokal ay en-US!

Kaya… kung ako ay isang Hindi mag-aaral, nag-aaral ng Ingles sa Purdue at nakakonekta sa pamamagitan ng VPN sa server ng paaralan, sa bakasyon sa Australia… mayroong 3 magkakaibang mga setting na kailangang ilapat sa aplikasyon upang ma-internationalised - at wala nakasalalay sa iba.

Ang aking lokal ay darating bilang en-US, ngunit ang aking timezone ay Australia, ngunit ang wikang hinihiling ko mula sa website ay maaaring Hindi. Kung nais kong iprograma ang aking aplikasyon upang magawa pagpapalagay batay sa lokal ng aking computer, magkakamali ako - ang pagpapakain sa Ingles sa isang timezone ng Silangan. Sa isip, ipo-program ko ang aking aplikasyon na inaalok kapwa mga setting ng wika at timezone ... ngunit hindi ko ipalagay ang mga ito batay sa lokal.

Iceland - ang panghuli na halimbawa

Hindi namin alam ang mga hamon sa maraming wika at maraming lugar sa Estados Unidos kung saan namin lahat nagsasalita ng English [sarcasm implied]. Sa ilang mga bansa, tulad ng Iceland, kahit na ang katutubong wika ay Icelandic, ang hindi kapani-paniwala na mga taga-Icelandic ay lumalaki na natututo ng 3 mga wika! Dahil ang Iceland ay isang bansa sa gitna ng Europa at Hilagang Amerika, gumagana ang kanilang mga kumpanya sa buong mga kontinente, wika, dayalekto ng wika at maraming timezones mula sa kanilang desktop!

Maraming mga website ng Icelandic ang itinayo sa US English, UK English, I Islandic, Spanish, Spanish, French at German! Isipin lamang kung gaano ito mapaghamong itayo Icelandair's mga application ng website at system ng ticketing ... wow!

DISCLAIMER: Nagkaroon ako ng ganap na kasiyahan na magtrabaho kasama ang mga magagaling na tao mula sa Icelandair at masasabi sa iyo na sila ang ilan sa mga pinaka may talento at magiliw na mga propesyonal na nasisiyahan akong makatrabaho. Ito ay isang kamangha-manghang bansa at tao! Pumunta sa pagbisita ... kunin ang Icelandair at tiyaking bisitahin ang Blue Lagoon!

Wika kumpara sa Pag-encode

Mayroong kahit na iba't ibang mga pag-encode ng character sa loob ng isang solong wika na hindi mahusay na naglalaro sa bawat isa! Halimbawa: Ang isang email sa Japan na nakasulat sa Shift-JIS ay maaaring mag-render na hindi mabasa sa computer ng isang Hapon na may lokalisasyong nakatakda sa ja-JP sapagkat kinikilala lamang ng kanilang mail server ang EUC-JP. Sa isip, dapat na maitakda ng isang customer kung anong pag-encode ang nais nila pati na rin kung anong wika - tiyakin lamang na ang encoding at wika ay tugma sa hinihiling ng kliyente.

Kung nais kong basahin ang Hapon, maaaring kailangan kong pumili ng parehong Hapon bilang aking wika AT Shift-JIS para sa pag-encode upang maipakita nang maayos ang wikang iyon. Narito ang ilang higit pang pagkalito upang idagdag sa ihalo ... ang ilang mga uri ng pag-encode ay sumusuporta sa maraming mga wika. Sinusuportahan ng UNICODE / UTF8 ang dose-dosenang. Ang baliktad ay totoo rin. Ang ilang mga wika ay maaaring mabasa sa maraming mga uri ng pag-encode. Kung walang katuturan iyan ... Humihingi ako ng paumanhin, ito ay isang napaka-kumplikadong isyu.

Balang araw ay naniniwala ako (umaasa) na magbabago ang lahat. Sa palagay ko ang mga orihinal na tagadisenyo ng mga code sa pag-localize ay inaasahan na ang combo ng wika ng bansa ay ang kailangan ... ngunit naging mas sopistikado kami. Tandaan, karamihan sa mga ito ay binuo bago ang isang Internet. Sa pagdating ng GIS, marahil ay maaaring piliin ng isang tao ang kanilang pag-encode at hahawakan ng GIS ang timezone at lokal na impormasyon.

internationalization

Bumalik sa suporta sa Internationalisasyon. Kung nais mong magbigay ng isang internationalized application, kailangan mong:

  1. Suportahan ang maraming uri ng pag-encode, wika, at magkaroon ng mga file ng pagsasalin upang maipakita ang mga salin na iyon.
  2. Payagan ang kliyente na itakda ang kanilang wika, at marahil ang kanilang uri ng pag-encode, kung kinakailangan.
  3. Suportahan ang mga time zone sa pamamagitan ng pagpapahintulot sa mga gumagamit na tukuyin ang kanilang timezone sa paghahambing sa GMT.
  4. Gumamit ng mga localization code nang may pag-iingat ... HINDI nila tumpak na inilalarawan kung ano ang hinihiling ng iyong gumagamit o kung ano ang mababasa nila.

Pagsasalin

Ang pagsasaling makina ay nasa umpisa pa lamang. Mayroong isang bilang ng mga website doon (at WordPress Plugins) na nag-aalok ng pagsasalin ng makina ng iyong site. Huwag tuksuhin na gawin ito ... mayroong dalawang kadahilanan kung bakit:

  1. Kung gagana ang pagsasalin ng makina, ang gumagamit na sumusuri sa iyong site ay magkakaroon na ng tagasalin upang makipagtulungan.
  2. Pagsuso ng translation ng machine.

Huwag kang maniwala? Narito ang isang Japanese translation para sa iyo:
Na-paste mula sa Masatsu File - isang taong masyadong maselan sa pananamit na may isang tonelada ng mga larawan ng mga pusa:

Japanese Blog Entry

???
- 00:29:35 ni masatsu

????
??????????????????????????

?????? (?)?

????
???????????????????????????????

???? (?)

?????????????????

??????????????
???
???

???????

???????????????????????????????

????
????
?????? Ag ??????????

???????

Pagsasalin ng Makina:

?? Hann ?????
-00: 29: 35 ni masatsu

Ang pangalan ng kamao santo ng isang elepante na lumitaw sa kahapon na "a / the fist fet fleet ?? tanod-gubat" "?? Hann ???? " kasama ang isang / ang artista sa radyo na si Yutaka Mizushima .....

? (?) na agad ang cuttlefish.

Dahil kahit ang artista sa radyo ng kamao santo, panginoon ????? ng isang / ang pusa ay ang quince ng Intsik ng isang Nagai Ichiro = dragon ball ang tauhan ng a / the ?? ang ranger ay mukhang ang mga tao na nakakatawa na sinabi madaling nalalaman.

?????? (Ang pawis) na kinalimutan ko nang buo sa taong ito "ang lihim ng pangalan ng super fleet", ng karaniwang pagsasanay bawat taon?,

?????? Kung sumulat ako ng mahina sa taong ito,

???? shrine ??? (pwede paano?)? headland cullion (?? hindi pinutol) Fukami ?? (? o obserbahan na magagawa?) isang / ang ito ang ginagawa

?????? Sa, ito ay nagiging "isang lata /? /?", Sa madaling salita, "kung fu", kapag pumila at binago ang ulo ng isang pangalan.

?????? Kahit na sinasabing taasan ang karagdagang dalawa diumano maaari itong maging anong uri ng pangalan.

Sinasabi na ang katotohanan ay "edad" dahil ang pilak na elemento ng simbolo ay Ag?, Bagaman ang pangalan ng "ang ???? pilak ”ang Takaoka? technician ng ???? iniisip ba na tinawag ang character na "?" ay ginamit sa pagsasama ng isang pelikula ng pilak na? kung tatawagin ito sa isang miyembro ng karagdagan.

?????? Gayunpaman, iniisip kong makasarili, na ang aking teorya ay hindi nauugnay na "?" ay kasama sa isang / ang karakter na Intsik.

Sigurado akong ang pag-baligtad ng polarity sa pagsasalin na ito ay magbibigay tulad ng nababasa isang diction sa Ingles. Naintindihan mo naman ang entry di ba?

2 Comments

  1. 1

    ang ibig mong sabihin Purdue?
    Oo naman - isang pawis na artista sa radyo ay nagtataka ng tamang paraan upang sabihin ang ilang mga bagay ....

Ano sa tingin ninyo?

Ang site na ito ay gumagamit ng Akismet upang mabawasan ang spam. Alamin kung paano naproseso ang data ng iyong komento.