El método, que apareció por primera vez en 2014, se basa en redes que se modelan a partir de la estructura neuronal del cerebro humano. La particularidad del método se aprecia más claramente en comparación con la traducción automática estadística (SMT): En la SMT, se comparan grandes cantidades de textos traducidos antes de la traducción real y los textos de origen y destino se asignan entre sí en función de la frecuencia y se transfieren a un diccionario virtual con reglas gramaticales. Estos pares de palabras constituyen la base de la traducción automática estadística.
La NMT también analiza textos bilingües, con la diferencia de que, gracias a una red neuronal artificial, se registran implícitamente las correlaciones gramaticales entre la lengua de origen y la de destino. De este modo, se pueden reconocer las dependencias de las palabras y reproducirlas correctamente, especialmente en las frases más largas. La legibilidad de los textos traducidos por máquinas neuronales ya es aparentemente mejor que la de los textos estadísticos.