Semántica

Análisis semántico: El «deseo de consumo» en redes sociales

May 18, 2021

El equipo lingüístico de Séntisis ha elaborado un análisis de nombres y grupos nominales sobre los que se expresa un deseo de consumo. El estudio utiliza como muestra de análisis el conjunto de mensajes recuperados mediante el hashtag #NoMeImportaGastarEn.

Nuestro motor de análisis revela el contenido de una conversación en redes sociales mediante la anotación semántica de mensajes por categorías. Esto se produce tras un entrenamiento que combina enfoques lógicos y estadísticos de lingüística computacional. Un paso más consiste en indagar en estas categorías. De esta forma, se puede extraer información relevante, como muestra el caso que presentamos a continuación.

La categoría deseo de consumo recupera automáticamente mensajes en los que un usuario expresa su intención o ganas de consumir o adquirir un bien determinado.

Del mismo modo, considerando la multiplicidad de registros lingüísticos que conviven en una red social como Twitter, un hashtag puede condensar todo el significado de un mensaje, como es el caso de #NoMeImportaGastarEn:

Una marca que pertenezca a un sector determinado puede medir su reputación online no solo contabilizando mensajes positivos o negativos, sino también recopilando categorías de contenido que, como deseo de consumo, marcan tendencias en una conversación. Sin embargo, en los análisis de reputación no debemos conformarnos con detectar tendencias en formas de categorías, sino que podemos y debemos indagar también en el contenido de estos mensajes y extraer información relevante.

Así, nuestro motor de análisis clasifica los mensajes que llevan #NoMeImportaGastarEn dentro de la categoría deseo de consumo, y adicionalmente puede recuperar datos lingüísticos, lo que supone un nivel más profundo de análisis. En la siguiente tabla podemos ver la frecuencia de aparición de algunos sustantivos que aparecen en el conjunto de mensajes clasificados como deseo de consumo. Según esta tabla, alfajores aparece en 21 mensajes distintos del total de 8720 mensajes que componen la muestra de análisis.


En esta funcionalidad añadida a la clasificación automática de mensajes, hay que tener en cuenta algunas particularidades lingüísticas:

• Hay errores ortográficos o desviaciones de la escritura convencional. En estos mensajes el sustantivo comida aparece varias veces con letras repetidas, formando palabras o tokens distintos, pero en todos los casos siempre extraemos una forma única (comida), insensible al error de las letras repetidas.

• Extraemos sustantivos que consisten en una sola palabra. Pero también podemos y debemos extraer estructuras análogas morfológicamente. No solo palabras que son nombres, sino también agrupaciones de palabras que funcionan como nombres. Lo que tradicionalmente conocemos como sintagmas nominales.

• Los sustantivos o grupos nominales tienen cada uno significados diferentes. Sin embargo, hay sustantivos que, aunque tengan formas de diferentes, están semánticamente relacionados. Uno de los componentes de nuestra base de datos almacena, precisamente, palabras próximas en significado.

Por esta razón, podemos extraer no solo palabras aisladas. Sino también el significado o parte del significado que subyace a estas palabras. Gracias a esto podríamos generar estadísticas sobre cuántos de esos sustantivos se enmarcan, por ejemplo, en el campo semántico de la comida.

Los ejemplos anteriores proceden de un corpus o conjunto de mensajes descargados de Twitter que contienen el hashtag #NoMeImportaGastarEn.

Contacta con nosotros si quieres tener acceso a este corpus o algunas estadísticas generadas a partir de él.

Contacta con nosotros