Análisis Comparativo de Clasificación Humana vs Inteligencia Artificial en Dinámicas Conversacionales Digitales
Rommel Contreras / Laboratorio IA, Logos & Contexto
Correo: rommeljose@gmail.com
Cumaná, Marzo 1 de 2026
Resumen
Este estudio presenta un análisis comparativo entre dos metodologías de clasificación aplicadas a un conjunto de datos de 5.313 mensajes provenientes de un grupo de chat durante un periodo de un año. Se evaluaron dos enfoques: (1) evaluación humana basada en inferencia pragmática personal y (2) clasificación automatizada mediante una Inteligencia Artificial (IA) basada en análisis léxico-semántico. Se diseñaron métricas cuantitativas para medir la utilidad comunicacional, el ruido estructural, la toxicidad latente y la calidez social. Los resultados evidencian divergencias críticas, particularmente en la detección de la categoría pasivo-agresiva (26,6% frente a 2,8%). El estudio discute las limitaciones de los modelos de lenguaje (LLMs) para capturar subtextos emocionales y propone un modelo híbrido de integración ponderada para futuros diagnósticos sociales digitales. Finalmente, se plantea la necesidad de desarrollar modelos LLMs adaptados a la realidad sociocultural de cada escenario específico que se pretenda analizar con asistencia de IA.
Palabras clave: Análisis conversacional, clasificación automática,
toxicidad latente, dinámica social digital, modelos híbridos, evaluación
comparativa.
1. Introducción
La medición de las dinámicas comunicacionales en
entornos digitales enfrenta un desafío ontológico: la brecha entre el
significado denotativo (lo que se dice) y el connotativo (lo que se quiere
decir). Mientras que los evaluadores humanos integran el contexto emocional, la
historia interaccional y las inferencias pragmáticas (Walters, 2023), los
modelos de Inteligencia Artificial (IA) priorizan patrones semánticos
explícitos y probabilidades estadísticas (Morales et al., 2023).
El objetivo de esta investigación es someter un
mismo conjunto de datos a ambos filtros interpretativos para cuantificar cómo
la mediación algorítmica transforma la percepción de la salud comunicacional de
un grupo.
2. Metodología
2.1 Procedimiento
Se analizó un conjunto de datos compuesto por: N = 5.313 mensajes recolectados durante un periodo ininterrumpido de un año (2025). Cada mensaje fue clasificado en seis categorías mutuamente excluyentes: Informativo, Cortesía/Social, Ornamental, Pasivo-agresivo, Religioso y SPAM/Cadenas.
2.2 Métricas de Análisis
Para estandarizar la comparación, se definieron
los siguientes indicadores:
●
Utilidad
Bruta (UB): Representa la
proporción de mensajes con contenido puramente informativo.
● Ruido Total (R): Suma de categorías que no aportan a la funcionalidad operativa del grupo.
● Índice Ruido/Utilidad (IRU): Relación de eficiencia comunicativa.
●
Coeficiente
de Toxicidad Latente (CTL):
Medida de fricción social indirecta.
● Índice de Calidez Social (ICS): Mide la cohesión a través de la cortesía y el
adorno social.
2.2.2 Clasificación Automatizada
Para la clasificación automatizada del corpus de
5.313 mensajes, se utilizó el modelo de lenguaje Claude (Anthropic, https://claude.ai). La herramienta fue empleada para el análisis
léxico-semántico de los datos, aplicando los mismos criterios de categorización
que el equipo humano. El uso de esta IA permitió procesar el volumen total del
corpus bajo patrones semánticos explícitos y probabilidades estadísticas para
su posterior comparación con la inferencia pragmática humana
3. Resultados
La clasificación humana y la automatizada
arrojaron visiones contrapuestas sobre la naturaleza del grupo.
3.1 Distribución de Categorías
La Tabla 1 resume los porcentajes obtenidos por ambos métodos. La diferencia más radical se observa en la categoría Pasivo-agresiva, donde la sensibilidad humana detectó casi diez veces más incidencia que la IA.
Tabla 1.Comparativa de Clasificación de Mensajes (%)
|
Categoría |
Clasificación
Humana |
Clasificación
IA |
|
Informativo |
37,5 |
63,7 |
|
Pasivo-agresivo |
26,6 |
2,8 |
|
Cortesía/Social |
17,6 |
18,0 |
|
Ornamental |
14,1 |
13.9 |
|
Religioso |
2,6 |
1,2 |
|
SPAM |
1,6 |
0,3 |
3.2 Indicadores
Derivados
Al aplicar las métricas, el diagnóstico
estructural cambia drásticamente según el observador.
●
Enfoque
Humano: El
● Enfoque IA: El
4. Discusión y
Análisis Comparativo
4.1 La Brecha
de la Toxicidad Latente y el Sesgo Cultural
La divergencia crítica
de
Este fenómeno subraya una debilidad estructural:
los modelos de lenguaje actuales (LLMs) operan bajo parámetros léxicos globales
que, con frecuencia, ignoran la realidad sociocultural de escenarios
específicos. En las dinámicas conversacionales digitales, elementos como la
ironía y la fricción social dependen estrictamente de códigos locales que la
IA, en su configuración estándar, no logra decodificar con la precisión
necesaria.
4.3 Hacia un
Modelo Adaptado
Más allá de la
integración ponderada establecida (0,6×IA+0,4×Humano), los resultados obtenidos sugieren la necesidad imperativa
de desarrollar o ajustar modelos LLMs que reconozcan las particularidades
dialécticas y culturales de cada entorno analizado. Solo mediante la
implementación de una IA situada contextualmente será posible reducir la
brecha entre el significado denotativo de los mensajes y la intención
pragmática real del usuario.
5. Conclusiones
Este estudio demuestra que el diagnóstico
comunicacional en entornos digitales no es un proceso neutral, sino que está
mediado por el marco interpretativo del observador. La discrepancia estadística
encontrada revela que un mismo ecosistema digital puede ser diagnosticado como
"socialmente friccionado" por un analista humano o como
"operativamente eficiente" por una inteligencia artificial estándar.
La conclusión fundamental de esta investigación
es que la integración de ambos enfoques es imperativa para obtener una
analítica que sea estadísticamente robusta pero sociológicamente válida. Sin
embargo, no basta con una combinación aritmética de resultados; el futuro del
análisis de datos sociales requiere de una IA situada contextualmente.
Se concluye que los modelos de lenguaje deben
evolucionar de una arquitectura léxica global hacia una capacidad de
procesamiento que reconozca la realidad sociocultural y dialéctica de
cada escenario. Solo mediante el entrenamiento o ajuste de modelos que
comprendan los códigos locales y las sutilezas de la ironía regional, podrá la
inteligencia artificial actuar como una herramienta de mediación y análisis
verdaderamente efectiva en la gestión de comunidades digitales complejas.
Agradecimientos
El autor expresa su gratitud a los colaboradores, cuya dedicación en la categorización manual del corpus de mensajes fue fundamental para establecer la base comparativa de este estudio. Su capacidad para identificar matices pragmáticos y subtextos emocionales permitió contrastar con precisión las limitaciones léxicas de la inteligencia artificial.
Declaración de uso de Tecnologías de IA Generativa En la preparación de este estudio, el autor utilizó la herramienta Claude (Anthropic) con el fin de realizar la clasificación masiva del corpus de datos y asistir en el refinamiento del estilo del manuscrito. De la misma manera, se deja constancia de que para el diseño y elaboración de las herramientas de clasificado se usó Gemini (Google). Tras el uso de esas herramientas, el autor revisó y editó el contenido para asegurar la precisión científica y se hace responsable del contenido final de la investigación.
Referencias
● Chaka, C. (2023). AI
content detectors seem not yet fully ready to accurately and convincingly
detect AI-generated content from machine-generated texts. Journal of Applied Learning and Teaching, 6(1), 94-106.
● Contreras, R. (2026, marzo). Radiografía
Conversacional: Clasificación Humana vs IA.Tecnología Cumanesa. https://tecnologiacumanesa.blogspot.com/2026/03/clasificacion-humana-vs-ia.html
● Contreras, R. (2026, 28 de febrero). Análisis
con datos reales de un grupo de WhatsApp. Tecnología Cumanesa. https://tecnologiacumanesa.blogspot.com/2026/02/analisis-con-datos-reales-de-un-grupo.html
● Morales, L. E., Barrios, E., & Pinto, D.
(2023). Artificial
Intelligence-Based Text Classification: Separating Human and Computer-Generated
Texts.
IberLEF 2023.
●
Newman, A., & Gopalkrishnan, K. (2023). AI
communication styles and decision making: A framework for digital interaction.
● Walters, W. H. (2023).
The accuracy of 16 publicly available AI text detectors in discriminating
between AI-generated and human-generated writing. Scientific Reports, 13(1), 1-12.



Inclusión cultural: Tu ayuda permite que la IA entienda nuestras realidades sociales, la idiosincrasia y la diversidad de nuestra forma de comunicarnos, evitando la discriminación y los sesgos.
.png)
