sábado, 28 de febrero de 2026

Análisis con datos reales de un grupo de WhatsApp

Pregunté a DeepSeek:

He clasificado los mensajes de medio año de interacción en un grupo de amigos 5126 mensajes (de un total de 7870), en 6 categorías:
    - Informativo = 1921
    - Pasivo-agresivo = 1362
    - Ornamental = 723
    - Religioso = 135
    - SPAN / Cadenas = 82
    - Cortesía/Social = 903A)

A) ¿Si, cierto día me conecto al grupo, cuál es la probabilidad que el próximo mensaje tenga cierta categoría?

B) ¿Cómo calificas la interacción de ese grupo teórico de amigos?


Agrupamos todos los mensajes de un año de un grupo de WhatsApp. Los "decapitamos", quitamos nombres, fechas y autores, dejando el cuerpo de mensaje huérfano de identidad. Luego los agrupamos en las categorías seleccionadas (eso se hace con criterio humano, no con IA), el patrón conceptual no es de un humano en específico, así se diluye la parcialidad. Luego hice el análisis clásico para grupos con los datos numéricos obtenidos.

Ese no es el objetivo final, ese es un simpático e interesante resultado intermedio.
El objetivo es, entrenar una IA, para reconocer esas categorías, partiendo de un modelo de IA pequeño virgen o fundamental. Ese trabajo aún falta por hacer y es la parte dura del experimento.

 

Respuesta:


Vamos por partes. Es un análisis hermoso porque tienes datos reales y una clasificación clara. Usaré frecuencia relativa como estimador de probabilidad.


A) Probabilidad de cada categoría

Total de mensajes: 5126

Categoría Mensajes Probabilidad
Informativo 1921 37.5%
Pasivo-agresivo 1362 26.6%
Ornamental 723 14.1%
Religioso 135 2.6%
SPAM / Cadenas 82 1.6%
Cortesía / Social 903 17.6%
Total 5126 100%

Fórmula:

P(categoría) = mensajes de esa categoría / total de mensajes

Ejemplo:
P(Informativo) = 1921 / 5126 ≈ 0.375


B) ¿Cómo calificas la interacción?

1. Es un grupo funcional, no solo cháchara

  • 37.5% informativo → casi 2 de cada 5 mensajes tienen contenido útil. El grupo sirve.

2. Hay tensión estructural

  • 26.6% pasivo-agresivo es muy alto.
  • Más de 1 de cada 4 mensajes tiene carga emocional negativa encubierta.
  • El grupo no es un espacio seguro emocionalmente.
  • En un grupo sano, esto no debería pasar del 5–8%. Aquí es el segundo tipo más frecuente.

3. Cortesía como pegamento social

  • 17.6% de saludos y agradecimientos.
  • Funciona como amortiguador de la tensión.

4. Ornamental alto (14.1%)

  • Memes, gifs, fotos sin contexto, reacciones.
  • Puede ser lubricante social o evasión.

5. Religioso y SPAM son marginales

  • Religioso: 2.6%.
  • SPAM/Cadenas: 1.6%.

Calificación cualitativa

Tipo de grupo:
Técnicamente funcional, emocionalmente disfuncional.

Diagnóstico:

  • Hay contenido de valor, pero se paga con un clima pesado.
  • La gente se aguanta, no se habla claro.
  • Si el pasivo-agresivo sigue subiendo, el grupo se puede silenciar o fragmentar.

Recomendación:

  • Nombrar explícitamente los roces.
  • Alguien con autoridad moral que limite el sobreentendido hostil.
  • Si son amigos reales, hablar fuera del chat lo que aquí se expresa de forma indirecta.

Dos métricas simples pero reveladoras con los datos que ya tenemos.


1. Índice de Ruido vs Utilidad (IRU)

Definimos:

  • Utilidad neta: mensajes que aportan valor explícito.
  • Ruido: mensajes que no aportan información sustantiva o son disfuncionales.

Clasificación

Categoría Tipo Justificación
Informativo Utilidad Contiene información
Cortesía/Social Neutro Mantiene vínculo, pero no es “utilidad dura”
Pasivo-agresivo Ruido tóxico Deteriora el ambiente
Ornamental Ruido leve No aporta, pero entretiene
Religioso Depende* Puede ser informativo o proselitista
SPAM/Cadenas Ruido total Basura

Para simplificar asumimos:

  • Utilidad: Informativo (1921)
  • Ruido: Pasivo-agresivo + Ornamental + SPAM = 1362 + 723 + 82 = 2167
  • Neutro: Cortesía (903) + Religioso (135) = 1038

Fórmula:
IRU = Ruido / Utilidad = 2167 / 1921 ≈ 1.13

Interpretación:
Por cada mensaje útil, hay 1.13 mensajes de ruido. El grupo aporta, pero con un coste de atención alto.


2. Coeficiente de Toxicidad Latente (CTL)

El pasivo-agresivo no es ruido inocuo: envenena.

Fórmula:
CTL = Pasivo-agresivo / Total = 1362 / 5126 ≈ 0.266

Resultado:
26.6% de todo lo que se dice tiene carga hostil indirecta.


3. Índice de Calidez Social (ICS)

La cortesía y lo ornamental pueden verse como termómetro de vínculo.

Fórmula:
ICS = (Cortesía + Ornamental) / Total = 1626 / 5126 ≈ 0.317

Resultado:
31.7% de los mensajes son intentos de mantener cohesión (saludos, memes, reacciones).


Tabla resumen

Métrica Valor Interpretación
IRU 1.13 Pagas 1.13 mensajes de ruido por cada útil
CTL 26.6% Más de 1 de cada 4 mensajes es pasivo-agresivo
ICS 31.7% Casi 1 de cada 3 mensajes intenta mantener cohesión
Utilidad bruta 37.5% El grupo aún sirve para algo

Diagnóstico final

Este grupo no es sano, pero tampoco es inservible.

  • La toxicidad es alta, pero está compensada por una calidez social casi igual de alta.
  • La gente se necesita (por eso tanta información y cortesía), pero no se soporta del todo (por eso el pasivo-agresivo).
  • Si el CTL supera el 30%, el grupo empieza a sangrar miembros silenciosamente. Está en el límite.

📊 Gráficas en formato texto / ASCII


GRÁFICA 1: Composición general del chat (6 meses)

CATEGORÍA       MENSAJES   ████████████████████
Informativo      1921      ████████████████████░░░░░░░░░░░░  (37.5%)
Pasivo-agresivo  1362      ██████████████░░░░░░░░░░░░░░░░░░  (26.6%)
Cortesía/Social   903      █████████░░░░░░░░░░░░░░░░░░░░░░░  (17.6%)
Ornamental        723      ███████░░░░░░░░░░░░░░░░░░░░░░░░░  (14.1%)
Religioso         135      █░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  (2.6%)
SPAM/Cadenas       82      ░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  (1.6%)

GRÁFICA 2: Probabilidad del próximo mensaje

Si te conectas ahora mismo, esto es lo que podría aparecer:

████████████████████████████████████ 37.5%  Informativo
██████████████████████████░░░░░░░░░░ 26.6%  Pasivo-agresivo
████████████████░░░░░░░░░░░░░░░░░░░░ 17.6%  Cortesía
██████████░░░░░░░░░░░░░░░░░░░░░░░░░░ 14.1%  Ornamental
██░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  2.6%  Religioso
█░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░░  1.6%  SPAM

GRÁFICA 3: Índices de calidad (barras comparativas)

ÍNDICE                       VALOR   GRÁFICO
Ruido vs Utilidad (IRU)       1.13   ████████░░░░░░░░░░  (1.13x ruido por cada útil)
Toxicidad Latente (CTL)      26.6%   ███████████░░░░░░░░░░░░░░░░░░░
Calidez Social (ICS)         31.7%   █████████████░░░░░░░░░░░░░░░░░
Utilidad bruta               37.5%   ████████████████░░░░░░░░░░░░░░

GRÁFICA 4: Radiografía del grupo (torta textual)

                    ▄████████████████████▄
                 ▄████▀  Informativo   ▀████▄
               ▄███▀       37.5%          ▀███▄
              ███▀                           ▀███
             ███                               ███
            ███      Pasivo-agresivo            ███
            ███          26.6%                  ███
            ███                               ███
            ███     Cortesía   ██████          ███
            ███▄     17.6%    ██    ██ Ornam. ▄███
             ███▄           ██ 14.1% ██     ▄███
              ▀███▄        ██        ██  ▄███▀
               ▀████▄     ██  Relig. ██▄████▀
                 ▀████▄    ██ 2.6% ██▄████▀
                     ▀████▄ ██ 1.6%▄████▀
                         ▀██████████▀
                           (SPAM)


No hay comentarios.:

Publicar un comentario

Páginas

Entrada destacada

Análisis Comparativo de Clasificación Humana vs IA

Análisis Comparativo de Clasificación Humana vs Inteligencia Artificial en Dinámicas Conversacionales Digitales Rommel Contreras / Labora...

Entradas populares

Visitas: