Domini IDN: indirizzi web con caratteri speciali
Internet diventa sempre più internazionale. Grazie all’International Telecommunication Union (ITU), più di tre miliardi di persone in tutto il mondo sfruttano le numerose possibilità del Word Wide Web, sempre più spesso offerte nella loro lingua madre. A rendere possibile tutto questo sono i cosiddetti nomi di dominio internazionali (IDN), a disposizione degli utenti dal 2003.
Registra subito un dominio .it in offerta speciale!
Registra ora il tuo dominio .it con un consulente personale incluso!
Che cos’è un nome di dominio internazionalizzato (IDN)?
Fino al 2003, i nomi di dominio potevano contenere solamente le lettere dell’alfabeto latino, numeri arabi da 0 a 9 e trattini (-) perché il Domain Name System (DNS), responsabile della conversione di URL in indirizzi IP, si basa sul set di caratteri standard ASCII (American Standard Code for Information Interchange). L’ASCII comprende quasi tutti i caratteri di una tastiera per la lingua inglese ed è poco rappresentativo per un progetto internazionale, come anche per Internet. Per risolvere questo inconveniente, è stato adottato come standard il sistema “Internationalizing Domain Names in Applications” (IDNA), che definisce una conversione standard da Unicode a ASCII e permette così l’uso nei domini di ogni simbolo presente in tutti gli alfabeti conosciuti.
I domini internazionalizzati, talvolta abbreviati in IDN o NDI, sono considerati una delle più grandi rivoluzioni nella storia di Internet. I primi ad approfittare di questi nomi di dominio sono gli utenti che usano un alfabeto asiatico, arabo o africano e vorrebbero creare offerte online nella loro lingua. Ma la novità dei domini internazionalizzati è stata accolta con piacere anche in paesi come la Germania, per via delle dieresi (caratteri come ü, ö e ä), e in Francia, data l’importanza degli accenti. A partire dal luglio 2012, anche in Italia è diventato possibile registrare nomi di dominio internazionalizzati. I caratteri speciali ammessi in un dominio .it sono i seguenti:
à, â, ä, è, é, ê, ë, ì, î, ï, ò, ô, ö, ù, û, ü, æ, œ, ç, ÿ, β
Nonostante l’uso di questi caratteri non sia molto comune nei domini .it e solo pochi provider offrano la possibilità di registrarli, è consentito. In generale vale che la scelta dei caratteri varia a seconda del Top Level Domain (TLD) scelto.
Come funziona lo standard IDNA
Per garantire che i nomi di dominio internazionalizzati possano essere elaborati su Internet da molti sistemi, che supportano il codice ASCII, ogni dominio IDN, scritto in Unicode, viene convertito in una cosiddetta stringa ACE, che si basa su caratteri ASCII. Nello specifico, questa procedura diventa lo standard con IDNA 2003 e la sua successiva modifica IDNA 2008, rilasciata nel 2010. La conversione da Unicode ad ASCII avviene lato client (browser, e-mail, programmi ecc.) e si basa su Punycode, un sistema di codifica standard.
Punycode
Il sistema di codifica Punycode, definito nella RFC 3492, è stato sviluppato al fine di poter rappresentare le stringhe Unicode in maniera chiara e senza perdite di qualità nei caratteri ASCII. Per farlo, tutti i caratteri non ASCII vengono rimossi dal nome del dominio, codificati e separati da un trattino. Questo codice spiega di quale simbolo Unicode si tratti e la sua posizione nel nome del dominio. Inoltre, ogni stringa ACE creata viene preceduta dal prefisso xn--, che indica chiaramente la stringa che codifica il dominio IDN in conformità allo standard IDNA e a Punycode.
Differenze tra IDNA 2003 e IDNA 2008
Nel 2003, prima della codifica con Punycode, gli URL internazionalizzati venivano normalizzati con una procedura detta Nameprep. In questo processo le maiuscole venivano convertite nelle minuscole, i caratteri speciali eliminati e i simboli di equivalenza uniformati. Ma con l’introduzione di IDNA 2008, Nameprep non è più parte del processo di conversione. IDNA non impone più alcuna normalizzazione, ma consiglia un algoritmo che trasforma maiuscole in minuscole.
Per questo circa 8000 simboli, che erano consentiti con il processo IDNA 2003, non vengono più supportati dallo standard IDNA2008. Rispetto a prima, molti simboli vengono interpretati diversamente dopo la modifica dello standard. Una discussione dettagliata della differenza tra IDNA 2003 e IDNA 2008 la trovate in Unicode Technical Standard 46#.
Problemi con i domini IDN
Oggi tutti i programmi internet contemporanei dovrebbero riuscire a comprendere i domini IDN. Ma, tra i problemi dei nomi di dominio internazionalizzati, talvolta c’è ancora il passaggio dallo standard IDNA 2003 a quello IDNA 2008, di cui si subiscono ancora le conseguenze, oltre che questioni relative alla sicurezza. Ad esempio, un malintenzionato può ingannare un utente rinviandolo ad un sito web fasullo allo scopo di carpire le sue informazioni personali. Una possibile soluzione per far fronte a queste difficoltà può essere quella di registrare più varianti di uno stesso nome di dominio (ad esempio una accentata e una non) e reindirizzarle al dominio principale tramite Redirect.