Email Me: lezama at lacartita.com



Si eres lingüista, no te preocupes demasiado por las matemáticas formales en el procesamiento del lenguaje natural (PLN).

En el ámbito del Procesamiento del Lenguaje Natural (PLN), una comprensión básica del álgebra lineal sí ayuda (en cierta medida) cuando se intenta laborar dentro del PLN. Fundamentalmente, la preocupación para todos nosotros los filósofos, lingüistas y psicólogos es ganarse la vida decentemente sin ser penalizados por nuestra falta de gratificación inmediata en el mundo laboral. Estas disciplinas generales vinculadas a las Ciencias Cognitivas nos llevaron por un camino muy enriquecedor, pero la consecuencia práctica de estar demasiado centrado en cualquiera de estos dominios también es muy real. La misma crítica se podría hacer hacia otras disciplinas dentro de la informática, pero al final del día, no son ellos quienes enfrentan altas tasas de desempleo.

También está el hecho de que, para muchos de nosotros, aunque no sea evidente de inmediato en un curso de Lingüística 101, ya hablamos el vocabulario formal de la lógica y la ciencia al describir datos lingüísticos.

Una matriz de características para describir transformaciones sintácticas justificadas en matrices de características referenciales de categorías léxicas (o cualquier otra característica lingüística) es similar a las matrices de álgebra lineal convencionales en su contexto más general. A continuación, considera las transformaciones siguientes entre oraciones y sus variantes:

OraciónCategorías Léxicas (Características)Transformación
El gato está en la alfombra.[Det, Sustantivo, Verbo, Preposición, Det, Sustantivo]Oración original
El gato está descansando en la alfombra.[Det, Sustantivo, Verbo, Verbo, Preposición, Det, Sustantivo]Sustitución: “descansando” en lugar de “en”
Un perro duerme en el sofá.[Det, Sustantivo, Verbo, Preposición, Det, Sustantivo]Generalización: “perro” en lugar de “gato”
Los perros están durmiendo en el sofá.[Det, SustantivoPlural, Verbo, GerundioVerbo, Preposición, Det, Sustantivo]Pluralización: “perros” y forma de gerundio de “dormir”
A los gatos les gusta el pescado.[SustantivoPlural, Verbo, Sustantivo]Simplificación: Eliminación de un determinante (“el”)
El pescado es gustado por los gatos.[SustantivoPlural, Verbo, Verbo, Preposición, SustantivoPlural]Voz pasiva
Tabla de transformaciones

Si hacer estas conexiones no es difícil, puedes comprender los lenguajes formales, incluyendo los lenguajes de programación. Por lo tanto, es recomendable involucrarse en los dominios pertinentes de las matemáticas y la lógica, incluso si no se tiene un conocimiento completo como el de un graduado en Ciencias de la Computación o Matemáticas. Esto es especialmente cierto si deseamos involucrarnos en el campo de la informática y utilizar herramientas empresariales, como lenguajes de programación específicos que en muchos casos son de propiedad intelectual de la empresa en la que trabajas. Es decir igual vas a aprender dentro de la empresa las idiosincridades del idioma de programación poco conocido por estos ambitos academicos.

En última instancia, el álgebra lineal desempeña un papel en la descripción de conceptos y mecanismos complejos que subyacen a diversas tareas de PLN. Sin embargo, si no tomas un curso completo, no te culpo. Desarrollar una intuición es suficiente para sobrevivir en la industria; esa es mi recomendación después de haber pasado más de una década en mis responsabilidades superpuestas en la industria y los medios de comunicación.

Intuición de Álgebra Lineal

En el PLN, la mayoría de los flujos de trabajo utilizan algún tipo de representaciones vectorizadas del significado. Desde mi perspectiva, mientras yo comprenda que algún proceso toma las co-ocurrencias de palabras y las transforma en representaciones binarias en una matriz bidimensional, estaré bien. Tome el ejemplo basico de Python como referencia y para visualizar este punto.


import numpy as np

# Sample co-occurrence data (word-word matrix)
co_occurrence_matrix = np.array([[0, 1, 0, 1],
                                  [1, 0, 1, 0],
                                  [0, 1, 0, 1],
                                  [1, 0, 1, 0]])

# Converting co-occurrence matrix to binary matrix
binary_matrix = (co_occurrence_matrix > 0).astype(int)

# Display the binary matrix
print("Binary Matrix Representation:")
print(binary_matrix)

Matriz en Python

Representación de la matriz palabra-palabra.

Representación de la matriz palabra-palabra:
```
0 1 0 1 
1 0 1 0 
0 1 0 1 
1 0 1 0
```

Representación lingüística:
- La palabra "gato" aparece con la palabra "perro" y la palabra "pájaro"
- La palabra "perro" aparece con la palabra "gato" y la palabra "ratón"
- La palabra "ratón" aparece con la palabra "perro" y la palabra "pájaro"
- La palabra "pájaro" aparece con la palabra "gato" y la palabra "ratón"

En esta representación, la matriz indica las relaciones de co-ocurrencia entre palabras reales. 
Cada fila y columna representa una palabra específica, y los valores en las celdas indican si las palabras correspondientes tienden a ocurrir juntas o no.

Ejemplo de matric

Por lo tanto, las incorporaciones de palabras y oraciones encapsulan información semántica en un espacio vectorial continuo. A través de operaciones de álgebra lineal en estas representaciones vectoriales, los sistemas de PLN pueden descubrir patrones subyacentes, similitudes y relaciones dentro de los datos textuales. Sin embargo, eso está automatizado, por lo que a menos que estés escribiendo documentos de investigación durante el resto de tu vida, realmente no importa si estás sacrificando esa cita, noche fuera o lo que sea para hacer los cálculos a mano.

De forma ironica, Bertrand Russell una vez comentó lo bueno que hubiera sido contar con cálculos lógicos formales de manera automatizada. Para Principia Matematica Russell se vio obligado calcular a mano. Entonces, a menos que estés siguiendo de cerca al gran filósofo en tus estudios, investigación o tareas empresariales (lo cual NO requiere tanto tiempo), no te preocupes por las matemáticas porque o bien una parte del cálculo tedioso está automatizado o puedes aprender rápidamente los componentes principales.

Además, el álgebra lineal abre oportunidades para realizar operaciones como el cálculo de productos punto en representaciones vectoriales. El producto punto sirve como medida de similitud entre vectores, permitiendo que los sistemas de PLN identifiquen fragmentos de texto que presentan rasgos semánticos similares. Por lo tanto, aprovechando el producto punto, los modelos de PLN pueden recuperar documentos relevantes y recomendar contenido similar a los usuarios en función de su entrada.

Además, el álgebra lineal facilita transformaciones y manipulaciones de representaciones vectoriales mediante operaciones como la multiplicación de matrices y las transformaciones matriciales.


import numpy as np

# Real words
words = ["cat", "dog", "mouse", "bird"]

# Word-Word matrix representation
matrix = np.array([[0, 1, 0, 1],
                   [1, 0, 1, 0],
                   [0, 1, 0, 1],
                   [1, 0, 1, 0]])

print("Word-Word Matrix Representation:")
for i in range(len(words)):
    for j in range(len(words)):
        print(matrix[i][j], end=" ")
    print()

# Matrix multiplication example
vector = np.array([0, 1, 1, 0])
result = np.dot(matrix, vector)

print("\nMatrix Multiplication (Vector Representation):")
print(result)

# Matrix transformations example
transpose = np.transpose(matrix)

print("\nMatrix Transpose:")
print(transpose)

Codigo entero

Estas operaciones desempeñan un papel vital en tareas como el análisis de sentimientos, la traducción automática y la generación de resúmenes, al permitir la codificación y decodificación de información textual en diferentes idiomas y dominios. Básicamente, se pueden utilizar vectores como descripciones indirectas (pero bastante precisas) del significado.

En fin, poseer una base sólida en álgebra lineal si es esencial para cualquiera que se adentre en el campo del Procesamiento del Lenguaje Natural. Comprender los principios de las representaciones vectorizadas, los algoritmos de agrupamiento, los productos punto y las operaciones matriciales proporciona a los profesionales las herramientas necesarias para navegar eficazmente por las complejidades de las tareas de PLN. Pero, a la misma vez, es mas valioso tener una intuicion basica a una aplicacion perfecta ya que mucho de los modulos estan automatizando las operaciones mas tediosas.

Al comprender el poder del álgebra lineal en el PLN, se pueden desentrañar las complejidades del lenguaje y aprovechar todo el potencial de la lingüística computacional para construir sistemas inteligentes e intuitivos para el procesamiento y comprensión de representaciones del lenguaje humano. A fin de cuentas, el debate sobre que es el lenguaje humano no es el mero fin de estas herramientas principalmente de ingeneria computacional.