Il ri­co­no­sci­men­to delle entità de­no­mi­na­te, in inglese “Named Entity Re­co­gni­tion” (NER), è una sot­to­di­sci­pli­na della lin­gui­sti­ca com­pu­ta­zio­na­le che si occupa di iden­ti­fi­ca­re e ca­ta­lo­ga­re le entità (nomi propri) nei testi, as­se­gnan­do­li a categorie spe­ci­fi­che. Questo processo è fon­da­men­ta­le nell’ambito dell’ap­pren­di­men­to au­to­ma­ti­co.

Cos’è la Named Entity Re­co­gni­tion (NER)?

La NER è una tecnica che permette di iden­ti­fi­ca­re i nomi propri in un testo e di as­se­gnar­li au­to­ma­ti­ca­men­te a categorie pre­de­fi­ni­te. Questo compito si definisce anche ri­co­no­sci­men­to dei nomi propri. I nomi propri o le entità de­no­mi­na­te sono singole parole o sequenze di parole che rap­pre­sen­ta­no entità reali. Ad esempio, possono riferirsi a una persona, un’azienda, un’autorità, un evento, un luogo, un prodotto specifico o anche a una data.

Questa di­sci­pli­na viene usata anche nell’ambito dell’ap­pren­di­men­to au­to­ma­ti­co e dell’IA e si inserisce nel campo dell’ela­bo­ra­zio­ne del lin­guag­gio naturale (NLP), grazie al quale algoritmi e computer ca­te­go­riz­za­no ed elaborano il lin­guag­gio in base a regole fisse. Oggi, grazie ai continui avan­za­men­ti, il ri­co­no­sci­men­to delle entità de­no­mi­na­te ottiene risultati accurati in molte lingue ed è difficile da di­stin­gue­re rispetto ai testi prodotti dall’essere umano.

I software IA di IONOS
Scopri la potenza del­l'in­tel­li­gen­za ar­ti­fi­cia­le
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati ec­cel­len­ti

Come funziona il ri­co­no­sci­men­to delle entità de­no­mi­na­te?

Esistono diversi metodi per ri­co­no­sce­re le entità de­no­mi­na­te: nel corso dell’articolo li esa­mi­ne­re­mo più da vicino. Ogni metodo prevede due fasi fon­da­men­ta­li, es­sen­zia­li per garantire il successo del pro­ce­di­men­to.

Iden­ti­fi­ca­zio­ne dei nomi propri

La prima fase consiste nell’iden­ti­fi­ca­re una o più entità de­no­mi­na­te. Non si tratta solo dei nomi propri più comuni, come “Mario Rossi”, ma anche di termini come “Lago di Como”, “Ri­sor­gi­men­to”, “Ferrari”, “Cam­pi­do­glio”, “Jurassic Park” o “12 ottobre 1986”, anch’essi con­si­de­ra­ti entità de­no­mi­na­te. Una volta che il sistema ha iden­ti­fi­ca­to questi nomi propri, ne evidenzia l’inizio e la fine, per­met­ten­do così di ri­co­no­scer­li all’interno di un testo naturale.

Ca­te­go­riz­za­zio­ne delle entità de­no­mi­na­te

Dopo aver iden­ti­fi­ca­to i nomi propri, il sistema li assegna a categorie definite. Queste categorie possono includere nomi di persone, luoghi, eventi storici, aziende, autorità, prodotti, date o anche titoli di film e opere d’arte. Pertanto, è im­por­tan­te che il sistema NER sia in grado di ri­co­no­sce­re le varianti di una stessa entità e di garantire che le estremità pre­ce­den­te­men­te definite (inizio e fine dell’entità) siano corretti.

Quali sono i metodi NER?

Sebbene il ri­co­no­sci­men­to delle entità de­no­mi­na­te segua sempre le due fasi prin­ci­pa­li, esistono diversi metodi per rag­giun­ge­re i risultati de­si­de­ra­ti. Di seguito ri­por­tia­mo i quattro approcci più comuni ed efficaci.

Analisi con dizionari

Questo è pro­ba­bil­men­te il metodo più semplice. Le entità vengono con­fron­ta­te con vari dizionari. Quando una parola o una sequenza di parole cor­ri­spon­de a un nome proprio presente nel di­zio­na­rio, viene ri­co­no­sciu­ta come entità de­no­mi­na­ta e clas­si­fi­ca­ta di con­se­guen­za.

Named Entity Re­co­gni­tion basata su regole

In questo metodo, si uti­liz­za­no regole definite per iden­ti­fi­ca­re le entità. Si creano degli schemi che vengono con­fron­ta­ti con i testi. Se c’è una cor­ri­spon­den­za, l’entità viene iden­ti­fi­ca­ta e ca­ta­lo­ga­ta. Questo metodo è par­ti­co­lar­men­te efficace per testi spe­cia­liz­za­ti e meno adatto per un uso generico.

Ap­pren­di­men­to au­to­ma­ti­co e IA

I migliori risultati si ottengono uti­liz­zan­do metodi basati sull’ap­pren­di­men­to au­to­ma­ti­co o sull’in­tel­li­gen­za ar­ti­fi­cia­le. I sistemi vengono ad­de­stra­ti su record di dati, facendo par­ti­co­la­re at­ten­zio­ne al ri­co­no­sci­men­to delle cor­re­la­zio­ni sta­ti­sti­che. Una volta com­ple­ta­to l’ad­de­stra­men­to, l’IA può ri­co­no­sce­re nomi propri in testi sco­no­sciu­ti e clas­si­fi­car­li. Più i dati di ad­de­stra­men­to sono completi e bi­lan­cia­ti, migliori saranno i risultati.

Approccio ibrido della NER basato su regole e sull’IA

Un approccio ibrido della Named Entity Re­co­gni­tion basata su regole e sup­por­ta­ta dall’in­tel­li­gen­za ar­ti­fi­cia­le può generare risultati ec­cel­len­ti. In questo sistema, le entità più semplici vengono iden­ti­fi­ca­te tramite regole pre­de­fi­ni­te, mentre l’in­tel­li­gen­za ar­ti­fi­cia­le si occupa di ri­co­no­sce­re e clas­si­fi­ca­re quelle più complesse.

Quali sono gli ambiti di ap­pli­ca­zio­ne della NER?

Le aree, attuali o future, che prevedono l’ap­pli­ca­zio­ne della Named Entity Re­co­gni­tion (NER) sono numerose. Di seguito alcune delle più rilevanti:

  • Analisi del sentiment: la NER viene già uti­liz­za­ta per valutare il feedback dei clienti e le tendenze, iden­ti­fi­can­do nomi di marchi, opinioni circa i prodotti e altre reazioni.
  • Business In­tel­li­gen­ce: la NER converte testi non strut­tu­ra­ti in dati strut­tu­ra­ti, utili per il recupero di in­for­ma­zio­ni e l’analisi di documenti fi­nan­zia­ri.
  • An­no­ta­zio­ne dei dati: in questo contesto la NER è fon­da­men­ta­le per svi­lup­pa­re e ad­de­stra­re modelli migliori per tra­du­zio­ni, clas­si­fi­ca­zio­ni e analisi testuali.
  • As­si­sten­za digitale: il ri­co­no­sci­men­to delle entità de­no­mi­na­te è una tecnica adatta a servizi come chatbot o as­si­sten­ti digitali. Analizza le richieste degli utenti, con­sen­ten­do di generare risposte per­so­na­liz­za­te in base alle spe­ci­fi­che entità de­no­mi­na­te rilevate nelle domande.
  • Parole chiave: il metodo viene uti­liz­za­to per filtrare entità come persone o luoghi all’interno di diversi articoli, per­met­ten­do di estrarre e me­mo­riz­za­re queste in­for­ma­zio­ni come metadati.
  • Motori di ricerca: la Named Entity Re­co­gni­tion analizza e migliora gli algoritmi di ricerca, con­sen­ten­do ai motori di ricerca di fornire risultati più accurati e per­ti­nen­ti.
  • Reti neurali: il ri­co­no­sci­men­to delle entità de­no­mi­na­te (NER) si applica anche nel campo delle reti neurali come la memoria a breve-lungo termine (LSTM) e altre tecniche simili.

Quali sono le pro­ble­ma­ti­che del ri­co­no­sci­men­to delle entità de­no­mi­na­te?

No­no­stan­te i notevoli avan­za­men­ti di questa tec­no­lo­gia e i risultati im­pres­sio­nan­ti che produce, la Named Entity Re­co­gni­tion (NER) presenta ancora alcune pro­ble­ma­ti­che. Una delle prin­ci­pa­li dif­fi­col­tà riguarda l’adat­ta­men­to dei modelli ad­de­stra­ti ai testi spe­cia­liz­za­ti, che spesso non produce i risultati attesi. Questo problema si verifica so­prat­tut­to quando i dati per l’ap­pren­di­men­to per tra­sfe­ri­men­to non sono suf­fi­cien­ti o ab­ba­stan­za specifici. Le nuove entità, che emergono co­stan­te­men­te, ri­chie­do­no ai modelli di basarsi su quantità di dati limitate, il che può com­pro­met­te­re le loro pre­sta­zio­ni. Approcci come lo zero-shot o il few-shot learning offrono soluzioni efficaci a questa pro­ble­ma­ti­ca, poiché con­sen­to­no ai modelli di fun­zio­na­re anche con una quantità ridotta di dati.

Vai al menu prin­ci­pa­le