📊 Radiografía Conversacional: Clasificación Humana vs IA
Durante un año se analizaron 5.313 mensajes de un grupo de chat (Wasaps) utilizando dos metodologías distintas:
- Clasificación realizada por evaluadores humanos
- Clasificación realizada por Inteligencia Artificial
El objetivo fue medir utilidad, ruido, toxicidad latente y eficiencia comunicacional.
1️⃣ Datos Base
Clasificación Humana
- Informativo: 1.921 (37,5%)
- Pasivo-agresivo: 1.362 (26,6%)
- Cortesía/Social: 903 (17,6%)
- Ornamental: 723 (14,1%)
- Religioso: 135 (2,6%)
- SPAM: 82 (1,6%)
Clasificación IA
- Informativo: 3-387 (63,7%)
- Cortesía/Social: 957 (18,0%)
- Ornamental: 739 (13,9%)
- Pasivo-agresivo: 147 (2,8%)
- Religioso: 66 (1,2%)
- SPAM: 17 (0,3%)
2️⃣ Definición de Métricas
📐 Utilidad Bruta (UB)
UB = Mensajes Informativos / Total de Mensajes
📐 Ruido Total (R)
R = Ornamental + Religioso + SPAM
📐 Índice Ruido/Utilidad (IRU)
IRU = R / UB
Interpretación:
- IRU > 1 → Más ruido que utilidad
- IRU = 1 → Equilibrio
- IRU < 1 → Predomina utilidad
📐 Coeficiente de Toxicidad Latente (CTL)
CTL = Pasivo-Agresivo / Total
📐 Índice de Calidez Social (ICS)
ICS = Cortesía + Ornamental
3️⃣ Resultados Comparativos
Clasificación Humana
- UB: 37,5%
- R: 18,3%
- IRU: 1,13
- CTL: 26,6%
- ICS: 31,7%
Clasificación IA
- UB: 63,7%
- R: 15,4%
- IRU: 0,24
- CTL: 2,8%
- ICS: 31,9%
4️⃣ Análisis Interpretativo
La diferencia más significativa se concentra en la categoría Pasivo-Agresivo:
- Humano: 26,6%
- IA: 2,8%
La IA reclasificó una gran porción de mensajes previamente considerados pasivo-agresivos como informativos o neutrales.
Hipótesis A — Sesgo emocional humano
- Mayor sensibilidad al tono implícito
- Detección de ironía y microagresiones
- Interpretación contextual relacional
Hipótesis B — Criterio estructural algorítmico
- Evaluación semántica explícita
- Menor peso al tono emocional
- Reducción de subjetividad
5️⃣ Impacto en la Narrativa del Grupo
Bajo análisis humano:
- Alta fricción social
- IRU mayor a 1
- Toxicidad latente significativa
Bajo análisis IA:
- Alta eficiencia comunicacional
- Predominio de utilidad
- Bajo conflicto estructural
La percepción cambia radicalmente dependiendo del método de observación.
6️⃣ Modelo Híbrido Propuesto
Clasificación Final = (0,6 × IA) + (0,4 × Humano)
Este modelo busca equilibrar sensibilidad emocional con consistencia estructural. Pero antes de implementarlo, se deben de explorar otros conjuntos de datos y validar esta propuesta.
Humana:
███████████████░░░░░░░░░░░░░░░░ 37.5%
IA:
████████████████████████████████████░░ 63.7%
Humana:
████████████████████░░░░░░░░░░░ 26.6%
IA:
██░░░░░░░░░░░░░░░░░░░░░░░░░░░░ 2.8%
Humana:
████████░░░░░░░░░░ 1.13
IA:
██░░░░░░░░░░░░░░░░ 0.24
7️⃣ Conclusión
Este estudio demuestra que la medición comunicacional no es neutral.
La IA mide estructura. El humano mide tono.
El mismo conjunto de datos puede parecer:
- Tóxico
- O altamente funcional
La diferencia no está en los mensajes. Está en el lente analítico utilizado.
8️⃣ Recomendaciones
- Realizar medición mensual para validar estabilidad.
- Crear subcategoría para ironía o crítica directa.
- Combinar análisis de sentimiento con clasificación estructural.
- Correlacionar utilidad comunicacional con resultados reales del grupo.
Conclusión final: El conflicto no siempre está en los datos. Muchas veces está en cómo decidimos interpretarlos.
No hay comentarios.:
Publicar un comentario