Domini IDN: una spiegazione sui nomi di dominio internazionalizzati
Secondo dati forniti dall’International Telecommunication Union (ITU), più di tre miliardi di persone in tutto il mondo sfruttano le numerose possibilità del World Wide Web, sempre più spesso offerte nella loro lingua madre. A rendere possibile tutto questo sono i nomi di dominio internazionalizzati (IDN), a disposizione degli utenti dal 2003. Ti spieghiamo come funzionano i domini IDN.
Per rendere gli IDN comprensibili al DNS e ad altri protocolli internet, nel 2003 è stato creato lo standard internet “Internationalizing Domain Names in Applications” (IDNA). Questo standard definisce una traduzione standardizzata da Unicode ad ASCII, consentendo così l’uso di caratteri non ASCII nei nomi di dominio.
Per questo circa 8000 simboli, che erano consentiti con il processo IDNA 2003, non vengono più supportati dallo standard IDNA2008. Rispetto a prima, molti simboli vengono interpretati diversamente dopo la modifica dello standard. Se ti interessa, trovi una discussione dettagliata della differenza tra IDNA 2003 e IDNA 2008 in Unicode Technical Standard 46#. La tabella seguente riassume le principali differenze.
Hai trovato questo articolo utile?
Che cos’è un nome di dominio internazionalizzato (IDN)?
L’IETF (Internet Engineering Task Force) definisce IDN i nomi di dominio che contengono caratteri speciali oltre alle lettere dell’alfabeto latino, come dieresi o caratteri di altri alfabeti. Tuttavia, questi nomi di dominio non sono compresi dal Domain Name System (DNS), responsabile della traduzione degli URL in indirizzi IP. Il DNS si basa sull’insieme limitato di caratteri standard ASCII.Per rendere gli IDN comprensibili al DNS e ad altri protocolli internet, nel 2003 è stato creato lo standard internet “Internationalizing Domain Names in Applications” (IDNA). Questo standard definisce una traduzione standardizzata da Unicode ad ASCII, consentendo così l’uso di caratteri non ASCII nei nomi di dominio.
Dominio
Registra il tuo dominio - Certificato SSL Wildcard incluso
- Registrazione di dominio sicura
- Indirizzo e-mail professionale da 2 GB
Come funziona lo standard IDNA
Per garantire che i nomi di dominio internazionalizzati possano essere elaborati su internet da molti sistemi, che supportano il codice ASCII, ogni dominio IDN, scritto in Unicode, viene convertito in una stringa ACE, che si basa su caratteri ASCII. Ad esempio, gli URL nel browser vengono visualizzati con le dieresi, mentre il server elabora gli indirizzi esclusivamente in formato ASCII. Nello specifico, questa procedura diventa lo standard con IDNA 2003 e la sua successiva modifica IDNA 2008, rilasciata nel 2010. La conversione da Unicode ad ASCII avviene lato client (browser, e-mail, programmi, ecc.) e si basa su Punycode, un sistema di codifica standard.Punycode
Il sistema di codifica Punycode, definito nella specifica RFC 3492, è stato sviluppato al fine di poter rappresentare le stringhe Unicode in maniera chiara e senza perdite di qualità nei caratteri ASCII. Per farlo, tutti i caratteri non ASCII vengono rimossi dal nome del dominio, codificati e separati da un trattino. Questo codice spiega di quale simbolo Unicode si tratti e la sua posizione nel nome del dominio. Inoltre, ogni stringa ACE creata viene preceduta dal prefisso xn–, che indica chiaramente la stringa che codifica il dominio IDN in conformità allo standard IDNA e a Punycode. Per ottenere una spiegazione dettagliata della procedura di codifica con alcuni esempi, consulta il nostro articolo su Punycode.Differenze tra IDNA 2003 e IDNA 2008
Nel 2003, prima della codifica con Punycode, gli URL internazionalizzati venivano normalizzati con una procedura Nameprep. In questo processo le maiuscole venivano convertite nelle minuscole, i caratteri speciali eliminati e i simboli di equivalenza uniformati. Ma con l’introduzione di IDNA 2008, Nameprep non fa più parte del processo di conversione. IDNA non impone più alcuna normalizzazione, ma consiglia un algoritmo che trasforma le maiuscole in minuscole.Per questo circa 8000 simboli, che erano consentiti con il processo IDNA 2003, non vengono più supportati dallo standard IDNA2008. Rispetto a prima, molti simboli vengono interpretati diversamente dopo la modifica dello standard. Se ti interessa, trovi una discussione dettagliata della differenza tra IDNA 2003 e IDNA 2008 in Unicode Technical Standard 46#. La tabella seguente riassume le principali differenze.
IDNA2003 | IDNA2008 |
---|---|
È necessaria una procedura Nameprep | Nessuna normalizzazione specificata |
Valido per Unicode 3.2 | Valido per le versioni di Unicode 5.2 e successive |
Regole rigorose per i font da destra a sinistra | Regole più chiare per i font da destra a sinistra |
Le lettere maiuscole e minuscole sono considerate caratteri distinti | Le lettere maiuscole vengono convertite in minuscole |
Molti simboli sono vietati, ad esempio i simboli grafici che non appartengono ad alcun sistema di scrittura e alcuni segni di punteggiatura | |
Viene eliminato il “remapping” (“rimappatura” in italiano) di alcuni caratteri Unicode, che potrebbe portare a irregolarità |