Il terzo passaggio dell’elaborazione del linguaggio naturale porta lo sviluppatore nel campo della semantica. Anche se sia la funzione sintattica che la classificazione attribuita ad una parola sono le stesse, è possibile che la parola abbia diversi significati. Le seguenti proposizioni ne sono un esempio:
Il commercialista fa la fattura
La strega fa la fattura
Chiunque conosca a sufficienza la lingua italiana capirebbe immediatamente che sebbene la parola “fattura” abbia la stessa funzione all’interno di queste due frasi, nella prima si fa riferimento ad un documento emesso a fini commerciali, mentre nella seconda si tratta di un atto di stregoneria. Per un computer questo non sarebbe invece così immediato. La conoscenza che sta alla base tra i due significati della parola “fattura”, il computer non la possiede; e saper distinguere tra le due accezioni risulta quindi estremamente complicato.
Per ovviare a questo problema i computer tentano di individuare il significato di una parola con l’aiuto delle parole che la precedono e che la seguono. Così facendo gli sarà possibile dedurre che quando la parola fattura è messa in connessione alla parola “commercialista”, allora il significato sarà quello legato all’ambito economico/fiscale, mentre quando nelle vicinanze della parola si troverà “strega”, allora si parlerà di stregoneria e superstizione. Il computer è in grado di apprendere questa differenza sulla base di un corpus, all’interno del quale è restituito il significato corretto di ogni parola.
Tutto considerato l’elaborazione del linguaggio naturale rimane un campo complesso: i computer devono già elaborare una grande quantità di singoli casi e per ogni parola con più di un possibile significato è facile che il computer la interpreti in maniera errata. Soprattutto nel campo della pragmatica vanno fatti ancora notevoli passi in avanti, poiché la comprensione di una qualsiasi proposizione è strettamente legata al contesto nella quale essa viene espressa, e per capirne il contesto, che è spesso legato comunque alla vita terrena, è dunque necessaria una buona conoscenza del mondo che manca ai computer. In modo particolare l’ironia, il sarcasmo e le metafore scherzose sono concetti che il computer fa molta fatica a comprendere; anche se ci sono stati diversi tentativi di classificarle.