Internasjonalisering, lokalisering, koding, Island og oversettelse av et japansk kattefoto-nettsted

internasjonalisering oversettelse

InternasjonaliseringDet er mye informasjon der ute når det gjelder internasjonalisering, lokalisering og koding innen webapplikasjoner. Det er også mye misforståelse om hva hver gir for en webapplikasjon. Her tar jeg ...

Når en nettleser oppretter en forbindelse til en webserver, passerer den ganske mange variabler og kommer med flere forespørsler, her er et eksempel:

FÅ / HTTP / 1.1
Vert: www.dknewmedia.com
Brukeragent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Godta: HTTP Godta = tekst / xml, applikasjon / xml, applikasjon / xhtml + xml, tekst / html; q = 0.9, tekst / vanlig; q = 0.8, bilde / png, * / *; q = 0.5
Godta-språk: en-us, en; q = 0.5
Godta-koding: gzip, deflater
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internasjonalisering

Internasjonalisering er en sammensetning av mange ting:

  1. Lokalisering: Evnen til å identifisere hvilket språk og sted en besøkende besøker fra. Dette gjøres gjennom HTTP-forespørsler der den besøkende identifiseres av et sted. I mitt tilfelle er det en-US. “En” er engelsk og “USA” er USA. Dette er en innstilling i operativsystemet mitt.
  2. Tidssoner: Evnen til å justere for tidssoner. Dette oppnås normalt ved å sette serveren til Greenwich Mean Time (GMT) og deretter la brukerne sette sin lokale forskyvning fra GMT.
  3. Tegnkoding: Dette er muligheten til å vise språk tegnsett riktig. Det er forskjellig fra lokalisering siden lokalisering kan fortelle meg språket og regionen til datamaskinen som kommer fra forespørselen, men den vil ikke fortelle meg hvilket språk leser ber ... det er opp til leseren!

Legg merke til i HTTP-overskriften min når nettleseren kom med forespørselen, den fortalte serveren at den ba om min lokalitet (Accept-Language: en-us); det må imidlertid også fortelle serveren hva tegnsett blir bedt om (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 and utf -8 er begge tillatte tegnsett.

Lokalisering

I denne fantastiske blandede verden dikterer lokalisering aldri språk lenger. Selv om jeg er i USA, kan jeg absolutt lese et annet språk ved hjelp av et annet tegnsett ... det er det som skjer når jeg bruker Google hindi (Jeg bruker egentlig ikke Google Hindi). Forespørselen min om språk og tegnsett er identisk som når jeg ber om Google engelsk siden, men jeg får faktisk en side som jeg ikke kan lese fordi jeg ikke har tegnsettet. Alt kommer opp ???????????… Imidlertid kan jeg laste det tegnsettet i Firefox (Firefox> Innstillinger> Avansert> Språk):

Firefox Last språk

Hvis jeg laster inn språket, kan jeg be om siden i det opprinnelige tegnsettet og vise det på datamaskinen min, selv om standardinnstillingen min er en-US!

Så ... hvis jeg er hindi-student, studerer jeg engelsk i Purdue og kobles via VPN til skolens server, på ferie i Australia ... det er tre forskjellige innstillinger som må brukes på applikasjonen for å bli virkelig internasjonalisert - og none avhenger av den andre.

Lokaliteten min vil komme opp som en-US, men tidssonen min er Australia, men språket jeg ber om fra nettstedet kan være hindi. Hvis jeg skulle programmere søknaden min til å lage antagelser basert på datamaskinens lokalitet, vil jeg ta feil - å mate personen engelsk i en østlig tidssone. Ideelt sett vil jeg programmere søknaden min til å tilby både innstillinger for språk og tidssone ... men jeg vil ikke anta dem basert på lokalitet.

Island - det ultimate eksemplet

Vi er uvitende om flerspråklige og flerspråklige utfordringer i USA der vi alle snakk engelsk [sarkasme underforstått]. I noen land, for eksempel Island, selv om morsmålet er islandsk, vokser det utrolige islandske folket opp med å lære 3 språk! Siden Island er et land midt i Europa og Nord-Amerika, jobber selskapene deres over flere kontinenter, språk, språkdialekter og flere tidssoner fra skrivebordet!

Mange islandske nettsteder er bygget på amerikansk engelsk, britisk engelsk, islandsk, spansk, spansk, fransk og tysk! Tenk deg hvor utfordrende det ville være å bygge Icelandair's nettsideapplikasjoner og billettsystemer ... wow!

FRASKRIVELSE: Jeg har hatt den største gleden av å jobbe med de fine folkene fra Icelandair og kan fortelle deg at de er noen av de mest talentfulle og vennlige fagfolkene jeg har hatt gleden av å jobbe med. Det er rett og slett et fantastisk land og folk! Gå på besøk ... ta Icelandair og sørg for å besøke Blue Lagoon!

Språk kontra koding

Det er til og med forskjellige tegnkodinger på et enkelt språk som ikke spiller bra med hverandre! Eksempel: En japansk e-post skrevet i Shift-JIS kan gjengis uleselig på en japansk persons datamaskin med lokalisering satt til ja-JP fordi e-postserveren deres bare gjenkjenner EUC-JP. Ideelt sett bør en kunde være i stand til å angi hvilken koding de ønsker, samt hvilket språk - ganske enkelt å sikre at kodingen og språket er kompatibelt med det klienten ber om.

Hvis jeg ønsker å lese japansk, kan det hende jeg må velge både japansk som språk OG Shift-JIS for koding for å vise språket riktig. Her er litt mer forvirring å legge til blandingen ... noen kodingstyper støtter flere språk. UNICODE / UTF8 støtter dusinvis. Det motsatte er også sant. Noen språk kan leses i mange kodingstyper. Hvis det ikke gir mening ... Jeg beklager, det er en veldig kompleks sak.

En dag tror jeg (håper) dette vil endre seg. Jeg tror de opprinnelige designerne av lokaliseringskoder håpet at språk-land-kombinasjonen ville være alt som trengs ... men vi har blitt langt mer sofistikerte. Husk at mye av dette ble utviklet før det eksisterte et internett. Med advent av GIS, kanskje en person kan velge koding, og GIS vil håndtere tidssone og lokal informasjon.

Internasjonalisering

Tilbake til støtte for internasjonalisering. Hvis du vil tilby en internasjonalisert applikasjon, må du:

  1. Støtt flere kodingstyper, språk og ha oversettelsesfiler for å vise disse oversettelsene.
  2. La klienten sette språk, og til og med kanskje kodingstype, om nødvendig.
  3. Støtt tidssoner ved å la brukerne referere til tidssonen sin i forhold til GMT.
  4. Bruk lokaliseringskoder med forsiktighet ... de viser IKKE nøyaktig hva brukeren din faktisk ber om, eller hva de kan lese.

Oversettelse

Maskinoversettelse er fortsatt i sin spede begynnelse. Det finnes en rekke nettsteder der ute (og WordPress plugins) som tilbyr maskinoversettelse av nettstedet ditt. Ikke la deg friste til å gjøre dette ... det er to grunner til at:

  1. Hvis maskinoversettelse fungerer, vil brukeren som sjekker ut nettstedet ditt allerede ha en oversetter å jobbe med.
  2. Maskinoversettelse suger.

Ikke tro meg? Her er en japansk oversettelse for deg:
Limt inn fra Masatsu-fil - en fyr med massevis av bilder av katter:

Japansk blogginnlegg

??
- 00:29:35 av masatsu

???????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
??????????????????????????????

?????????????????????????????????? (?)

?????????????????

??????????????
??
??

???????????????????????????????????????

???????????????????????????????

?????????????????????????????????????
??????????????????????????????????
??????????? Ag ????????????????

?????????????????????????????????????

Maskinoversettelse:

?? Hann ?????
-00: 29: 35 av masatsu

Navnet på nevehelgen til en / elefanten som dukket opp på gårsdagens “a / the beast fist flåten ?? ranger ”“ ?? Hann ???? ” med en / radioskuespilleren Yutaka Mizushima….

? (?) som gjør blekksprut lett.

For til og med radioskuespilleren til knyttnevehelgen, mester ????? av en / katten er den kinesiske kvede av en Nagai Ichiro = drakule staven til en / den ?? ranger ser ut som menneskene som vittige bemerkninger vet lett.

?????? (Svetten) som jeg glemte helt i år "hemmeligheten bak superflåten", vanlig praksis hvert år?,

?????? Hvis jeg skriver for sent i år,

??????? helligdom ??? (kan hvordan?)? nesekull (?? kutt ikke) Fukami ?? (? eller observer i stand til?) er det det som gjør

?????? Med blir det "en boks /? /?", Med andre ord "kung fu" når du stiller opp og skifter hodet til et / navnet.

?????? Selv om det sies å øke ytterligere to angivelig, kan det bli hva slags navn.

Sannheten sies å være "alder" fordi sølvelement-symbolet er Ag?, Selv om navnet på "the ????" sølv ”Takaoka? tekniker av ??????? tenkte at karakteren kalt “?” ble brukt sammen med en silver'screen? -film, hvis den kaller det med et tilleggsmedlem.

?????? Imidlertid tenker jeg egoistisk, at teorien min ikke er relatert til at "?" er inkludert i en / den kinesiske karakteren.

Jeg er sikker på at omvendt polaritet på denne oversettelsen vil gi en like lesbar diksjon på engelsk. Du forsto oppføringen, ikke sant?

2 Kommentarer

  1. 1

Hva tror du?

Dette nettstedet bruker Akismet for å redusere spam. Lær hvordan kommentaren din behandles.