Secondo dati forniti dall’In­ter­na­tio­nal Te­le­com­mu­ni­ca­tion Union (ITU), più di tre miliardi di persone in tutto il mondo sfruttano le numerose pos­si­bi­li­tà del World Wide Web, sempre più spesso offerte nella loro lingua madre. A rendere possibile tutto questo sono i nomi di dominio in­ter­na­zio­na­liz­za­ti (IDN), a di­spo­si­zio­ne degli utenti dal 2003. Ti spie­ghia­mo come fun­zio­na­no i domini IDN.

Che cos’è un nome di dominio in­ter­na­zio­na­liz­za­to (IDN)?

L’IETF (Internet En­gi­nee­ring Task Force) definisce IDN i nomi di dominio che con­ten­go­no caratteri speciali oltre alle lettere dell’alfabeto latino, come dieresi o caratteri di altri alfabeti. Tuttavia, questi nomi di dominio non sono compresi dal Domain Name System (DNS), re­spon­sa­bi­le della tra­du­zio­ne degli URL in indirizzi IP. Il DNS si basa sull’insieme limitato di caratteri standard ASCII.

Per rendere gli IDN com­pren­si­bi­li al DNS e ad altri pro­to­col­li internet, nel 2003 è stato creato lo standard internet “In­ter­na­tio­na­li­zing Domain Names in Ap­pli­ca­tions” (IDNA). Questo standard definisce una tra­du­zio­ne stan­dar­diz­za­ta da Unicode ad ASCII, con­sen­ten­do così l’uso di caratteri non ASCII nei nomi di dominio.

Acquista e registra il tuo dominio con il provider n°1 in Europa
  • Domain Connect gratuito per una con­fi­gu­ra­zio­ne facile del DNS
  • Cer­ti­fi­ca­to SSL Wildcard gratuito
  • Pro­te­zio­ne privacy inclusa

Come funziona lo standard IDNA

Per garantire che i nomi di dominio in­ter­na­zio­na­liz­za­ti possano essere elaborati su internet da molti sistemi, che sup­por­ta­no il codice ASCII, ogni dominio IDN, scritto in Unicode, viene con­ver­ti­to in una stringa ACE, che si basa su caratteri ASCII. Ad esempio, gli URL nel browser vengono vi­sua­liz­za­ti con le dieresi, mentre il server elabora gli indirizzi esclu­si­va­men­te in formato ASCII. Nello specifico, questa procedura diventa lo standard con IDNA 2003 e la sua suc­ces­si­va modifica IDNA 2008, ri­la­scia­ta nel 2010. La con­ver­sio­ne da Unicode ad ASCII avviene lato client (browser, e-mail, programmi, ecc.) e si basa su Punycode, un sistema di codifica standard.

Punycode

Il sistema di codifica Punycode, definito nella specifica RFC 3492, è stato svi­lup­pa­to al fine di poter rap­pre­sen­ta­re le stringhe Unicode in maniera chiara e senza perdite di qualità nei caratteri ASCII. Per farlo, tutti i caratteri non ASCII vengono rimossi dal nome del dominio, co­di­fi­ca­ti e separati da un trattino. Questo codice spiega di quale simbolo Unicode si tratti e la sua posizione nel nome del dominio. Inoltre, ogni stringa ACE creata viene preceduta dal prefisso xn–, che indica chia­ra­men­te la stringa che codifica il dominio IDN in con­for­mi­tà allo standard IDNA e a Punycode. Per ottenere una spie­ga­zio­ne det­ta­glia­ta della procedura di codifica con alcuni esempi, consulta il nostro articolo su Punycode.

Dif­fe­ren­ze tra IDNA 2003 e IDNA 2008

Nel 2003, prima della codifica con Punycode, gli URL in­ter­na­zio­na­liz­za­ti venivano nor­ma­liz­za­ti con una procedura Nameprep. In questo processo le maiuscole venivano con­ver­ti­te nelle minuscole, i caratteri speciali eliminati e i simboli di equi­va­len­za uni­for­ma­ti. Ma con l’in­tro­du­zio­ne di IDNA 2008, Nameprep non fa più parte del processo di con­ver­sio­ne. IDNA non impone più alcuna nor­ma­liz­za­zio­ne, ma consiglia un algoritmo che trasforma le maiuscole in minuscole.

Per questo circa 8000 simboli, che erano con­sen­ti­ti con il processo IDNA 2003, non vengono più sup­por­ta­ti dallo standard IDNA2008. Rispetto a prima, molti simboli vengono in­ter­pre­ta­ti di­ver­sa­men­te dopo la modifica dello standard. Se ti interessa, trovi una di­scus­sio­ne det­ta­glia­ta della dif­fe­ren­za tra IDNA 2003 e IDNA 2008 in Unicode Technical Standard 46#. La tabella seguente riassume le prin­ci­pa­li dif­fe­ren­ze.

IDNA2003 IDNA2008
È ne­ces­sa­ria una procedura Nameprep Nessuna nor­ma­liz­za­zio­ne spe­ci­fi­ca­ta
Valido per Unicode 3.2 Valido per le versioni di Unicode 5.2 e suc­ces­si­ve
Regole rigorose per i font da destra a sinistra Regole più chiare per i font da destra a sinistra
Le lettere maiuscole e minuscole sono con­si­de­ra­te caratteri distinti Le lettere maiuscole vengono con­ver­ti­te in minuscole
Molti simboli sono vietati, ad esempio i simboli grafici che non ap­par­ten­go­no ad alcun sistema di scrittura e alcuni segni di pun­teg­gia­tu­ra
Viene eliminato il “remapping” (“ri­map­pa­tu­ra” in italiano) di alcuni caratteri Unicode, che potrebbe portare a ir­re­go­la­ri­tà

Problemi con i domini IDN

Oggi tutti i programmi internet con­tem­po­ra­nei do­vreb­be­ro riuscire a com­pren­de­re i domini IDN. Ma, tra i problemi dei nomi di dominio in­ter­na­zio­na­liz­za­ti, talvolta c’è ancora il passaggio dallo standard IDNA 2003 a quello IDNA 2008, di cui si subiscono ancora le con­se­guen­ze, oltre a questioni relative alla sicurezza. Ad esempio, un ma­lin­ten­zio­na­to può ingannare un utente rin­vian­do­lo a un sito web falso allo scopo di carpire le sue in­for­ma­zio­ni personali. Una possibile soluzione per far fronte a queste dif­fi­col­tà può essere quella di re­gi­stra­re più varianti di uno stesso nome di dominio e rein­di­riz­za­re la variante se­con­da­ria al dominio prin­ci­pa­le tramite un rein­di­riz­za­men­to del dominio

Controllo Dominio
.
Vai al menu prin­ci­pa­le