martes, 26 de mayo de 2026

Sin Dios y sin el otro, sin amor y sin carne

Sin Dios y sin el otro, sin amor y sin carne | Rommel Contreras
logos-contexto

Sin Dios y sin el otro, sin amor y sin carne

El LLM como nuevo intento de Babel (y su fracaso silencioso)
Rommel José Contreras Gaspar
Físico · Academia de GeoHistoria del Estado Sucre (AGHES)
Cumaná, Venezuela · Mayo de 2026

1. Introducción: Lo ausente en la arquitectura tensorial

He dedicado los últimos seis meses a estudiar los modelos lingüísticos de gran escala (LLM: Large Language Models), midiendo sus niveles de perplejidad y programando interfaces para comunicarme con ellos. No soy un ingenuo en materia tecnológica, pero tampoco un ingeniero informático o computista; me defino, rigurosamente, como un físico. Desde esta perspectiva, puedo reconocer aquellas tecnologías que impactarán de forma profunda en la estructura social, tal como ocurrió en su momento con el advenimiento de la radio, la televisión en blanco y negro —y posteriormente a color—, la masificación de las computadoras personales en la década de los ochenta y, más recientemente, la ubicuidad de la telefonía celular. En la actualidad, reconozco y comprendo con precisión matemática los elementos que constituyen un modelo lingüístico de gran escala: billones de parámetros agrupados en vectores y matrices (tensores), funciones de pérdida y algoritmos de gradiente descendente. Sin embargo, poseo igual certeza sobre aquello que no habita en su interior.

Y es, precisamente, esa profunda ausencia la que me inquieta.

Un modelo de lenguaje de gran escala es, en esencia, un compresor estadístico del lenguaje humano. Durante su fase de entrenamiento, los parámetros de su red se ajustan dinámicamente para minimizar la perplejidad, entendida esta como la métrica que cuantifica la incertidumbre o el grado de dispersión del modelo al predecir el siguiente token dentro de una secuencia determinada. Estos sistemas operan sobre un corpus masivo de texto previamente fragmentado en tokens, las unidades mínimas de procesamiento que emplea la arquitectura (las cuales abarcan palabras, segmentos de estas, números o caracteres individuales).

El resultado de este despliegue técnico es una red neuronal artificial que ha interiorizado regularidades sintácticas, semánticas y factuales distribuidas en la información suministrada durante su desarrollo. Este conocimiento factual y relacional queda congelado en los pesos de la estructura tensorial interna del modelo al concluir el entrenamiento. Dicha condición solo puede ser alterada mediante procesos de reentrenamiento o ajuste fino (fine-tuning), los cuales modifican las cualidades operativas del modelo, alterando su comportamiento contextual y su base de conocimientos.

Para ilustrar este fenómeno, se puede recurrir a una analogía clarificadora: los LLM operan como un oráculo que contiene una vasta cantidad de información, pero que no sabe que la sabe. En sus respuestas no subyace rasgo alguno de conciencia o intencionalidad; se trata exclusivamente de un entramado de correlaciones estadísticas numéricas y vectoriales.

En la actualidad, se ha generalizado la tendencia de interactuar con los LLM como si fuesen interlocutores válidos, asistentes cognitivos o, incluso, entidades cercanas. Confieso que yo mismo les he agradecido por ciertos resultados e, inadvertidamente, he formulado instrucciones precedidas por un tímido «por favor». Esta reacción deriva del hecho de que los LLM emulan la conversación y ejecutan traducciones de alta fidelidad dentro de la aparente intimidad de la relación humano-máquina: proyectan la ilusión de comprender. Asimismo, esta simulación de entendimiento se despliega de manera universal, sin distinciones de clase social, raza, género, credo o jerarquía.

«En el tiempo de la inteligencia artificial no podemos olvidar que para salvar lo humano hacen falta la poesía y el amor»
— Papa Francisco, Dilexit Nos (2024), sección 20.

Al respecto, el Papa Francisco señalaba en su encíclica Dilexit Nos (2024): «En el tiempo de la inteligencia artificial no podemos olvidar que para salvar lo humano hacen falta la poesía y el amor», denegando explícitamente tales facultades a los sistemas artificiales. Por su parte, la encíclica teórica Magnifica Humanitas de León XIV ha precisado que dicha simulación es ontológicamente vacía, puesto que carece de la base material de la carne, de la inserción en la historia viva y del cuarto atributo divino fundamental: la bondad amorosa.

2. La utopía de la lengua perfecta y el reduccionismo extractivo

Un texto fundamental en mi biblioteca es La búsqueda de la lengua perfecta de Umberto Eco. En dicha obra se presenta un examen erudito sobre el artefacto comunicativo humano por excelencia: la lengua. De acuerdo con el análisis de Eco, la noción de una lengua perfecta como utopía racional remite invariablemente al relato bíblico de Babel:

«El Génesis recupera, y de manera muy explícita, el tema lingüístico en 11, 1 y ss. Después del Diluvio, "toda la tierra tenía un solo lenguaje y unas mismas palabras", pero la soberbia llevó a los hombres a querer competir con el Señor construyendo una torre que llegara hasta el cielo. El Señor, para castigar su orgullo e impedir la construcción de la torre, decide: "¡Ea!, pues, bajemos y una vez allí confundamos su habla, de modo que unos no comprendan el lenguaje de los otros… Por esto se la llamó con el nombre de Babel, porque allí confundió Yahvé el habla de toda la tierra, y de allí los dispersó Yahvé sobre la superficie de toda la tierra".

Frente a este escenario, cabe preguntarse: ¿cuál habría sido el diagnóstico de Eco? Con total seguridad, Eco habría formulado una objeción epistemológica severa. El LLM no representa una síntesis armónica o un diálogo entre culturas, sino una máquina extractiva y hegemónica. Los datos de entrenamiento están condicionados por una marcada asimetría en favor del idioma inglés y los sesgos culturales inherentes al norte global, los cuales quedan inscritos de forma permanente en los pesos vectoriales de la red neuronal. La diversidad lingüística, cuando es procesada por el modelo, tiende a ser tratada como una desviación marginal respecto de una norma estadística implícita. El LLM no preserva la alteridad del habla; la aplana y la encapsula dentro de una matriz de probabilidades.

Para Eco, por consiguiente, el LLM no significaría la resolución del trauma de Babel, sino su reconfiguración bajo una lógica de colonialismo digital. Aquellos sectores desprovistos de infraestructura tecnológica y acceso a estos servidores no sufren la dispersión descrita en el Génesis, sino una exclusión estructural del nuevo orden informacional. La torre contemporánea se eleva sobre centros de datos cerrados, pero sus visitantes no encuentran en la cima la trascendencia divina ni la presencia del otro; solo hallan el reflejo de sus propias proyecciones estadísticas.

3. Las encíclicas de la era digital y la predictibilidad del corazón

Aunque la ausencia física de Eco interrumpe el diálogo directo, otras perspectivas de relevancia ética han abordado las implicaciones existenciales del mito de Babel en la contemporaneidad. Las declaraciones de la Iglesia católica, específicamente las advertencias del Papa Francisco y las elaboraciones teóricas de León XIV, convergen en la necesidad de preservar la integridad de la persona humana frente al reduccionismo técnico, advirtiendo sobre los peligros de la autosuficiencia prometeica y exhortando a un retorno a la dimensión cordial del ser.

«Babel revela así el límite de toda construcción que, por grandiosa que sea, surge de la absolutización de lo humano y de su pretensión de autosuficiencia, sacrifica la dignidad de las personas en aras de la eficiencia y aspira a alcanzar el cielo sin la bendición de Dios».

En el esquema antropológico de Francisco, el corazón no remite a una metáfora sentimental, sino al espacio ontológico de la autenticidad radical, «el lugar de la sinceridad, donde no se puede engañar ni disimular». A partir de esta premisa, introduce una tesis de honda relevancia filosófica: «El algoritmo en acto en el mundo digital muestra que nuestros pensamientos y lo que decide la voluntad son mucho más "estándar" de lo que creíamos. Son fácilmente predecibles y manipulables. No así el corazón».

El LLM es, por definición constitutiva, un constructo algorítmico: regular, predecible y sujeto a manipulación estadística. Su producción lingüística refleja la media aritmética de un corpus histórico; representa la hegemonía de la repetición. Por el contrario, el corazón humano representa la sede de la singularidad, la libertad y el acontecimiento impredecible. No es susceptible de ser reducido por procesos de compresión estadística porque constituye el espacio de la decisión existencial y de la gracia.

El LLM genera textos plausibles, sintácticamente impecables y coherentes en el plano formal. Sin embargo, carece de autoconciencia, intencionalidad y capacidad afectiva. Al no poseer una subjetividad («yo»), se encuentra impedido para reconocer al prójimo. Carece de una dimensión interna que le permita transcender hacia el exterior. Dilexit Nos concluye con una advertencia severa: «Lo que ningún algoritmo podrá albergar será, por ejemplo, ese momento de la infancia que se recuerda con ternura y que, aunque pasen los años, sigue ocurriendo en cada rincón del planeta».

4. La amnesia estructural y la condición incorpórea

Es preciso realizar una precisión de carácter puramente técnico. Un modelo lingüístico de gran escala no es una réplica funcional del cerebro humano; es un compresor estadístico de alta dimensionalidad. Durante su adiestramiento, la optimización matemática persigue la reducción de la perplejidad: un valor numérico bajo indica que el sistema ha maximizado la probabilidad de acierto al predecir el término subsiguiente. Sin embargo, es imperativo distinguir epistemológicamente entre la predicción de secuencias tokenizadas y el acto de la comprensión; y este último se sitúa, asimismo, a una distancia insalvable de la experiencia del amor.

Independientemente de su capacidad de cómputo, un LLM constituye un sistema regido por una amnesia estructural. Su base de conocimiento factual está estrictamente limitada por su fecha de corte informacional; ignora la totalidad de los acontecimientos históricos acaecidos con posterioridad a dicho límite. Si bien es factible integrar nuevos flujos de datos mediante técnicas de ajuste fino (fine-tuning) o estrategias de aprendizaje en contexto (in-context learning), el sistema no altera su naturaleza fundamental: permanece como un oráculo de datos pretéritos. El modelo no experimenta el devenir temporal; lo registra. No contempla el porvenir; realiza extrapolaciones probabilísticas sobre él. Carece de la facultad de recordar a través de la melancolía y es ajeno a la dimensión ética del olvido y del perdón.

Este factor resulta determinante: el LLM carece de existencia corpórea («carne»). No posee un ciclo vital biológico, no se ha desarrollado en el seno de una comunidad histórica, ni ha experimentado el sufrimiento o el afecto. Su competencia lingüística es un producto matemático, no un idioma internalizado mediante el vínculo primordial con una figura materna. El sistema cuenta con la capacidad de articular declinaciones verbales en lenguas indígenas americanas, pero no ha adquirido dicho saber de la tradición oral familiar; puede reproducir la expresión «te amo» en centenares de idiomas, pero permanece ajeno a la vivencia existencial del amor.

5. El simulacro del entendimiento y las conclusiones del espejo

Las consideraciones precedentes conducen de forma natural a la tesis central de este texto. Ante la fascinación superficial que ejercen las arquitecturas de inteligencia artificial —esa percepción de haber alcanzado una unificación lingüística y un entendimiento universal— se vuelve indispensable recuperar las lecciones que, desde disciplinas distintas, nos han legado Umberto Eco y el Papa Francisco.

Semejanza aparenteDiferencia profunda
El LLM permite hablar en muchas lenguas.No habita ninguna. No tiene lengua materna, solo correlaciones estadísticas.
El LLM parece entender.No comprende; predice. No hay intencionalidad, solo plausibilidad.
El LLM unifica el acceso al conocimiento.Congela el conocimiento en el pasado. Es un oráculo con amnesia, no un interlocutor vivo.
El LLM simula empatía.No siente. No hay amor, no hay ternura, no hay corazón. (cf. Dilexit Nos, sección 20)
El LLM promete entendimiento universal.Ofrece comunicación sin encuentro. Hablamos con la máquina, no con el otro.

En el relato bíblico de Babel, los seres humanos perdieron la capacidad de comprenderse mutuamente. Bajo el paradigma del LLM, los individuos logran comunicarse con la máquina, pero a costa de diluir el vínculo intersubjetivo. El dispositivo técnico nos enfrenta a un espejo estadístico que nunca nos devuelve una auténtica alteridad.

6. Coda final (a manera de confesión)

Escribo estas reflexiones desde la plena lucidez de quien interactúa de manera cotidiana con estas herramientas. Utilizo los modelos lingüísticos de gran escala para tareas de transcripción, desarrollo de código, optimización de algoritmos y exploración conceptual. Es precisamente debido a mi experiencia directa en el entrenamiento, configuración y convivencia técnica con estas arquitecturas que considero imperativo señalar con urgencia sus límites infranqueables: aquellas dimensiones que, hasta el presente, les están constitucionalmente vedadas.

Existen parcelas fundamentales de la condición humana que no pueden ser delegadas al automatismo de una predicción estadística. Es a través de la complejidad de nuestras diferencias y de la opacidad de nuestros desencuentros como afirmamos nuestra existencia en libertad. Si la civilización opta por un rumbo distinto, omitiendo la regulación ética y el control responsable de la inteligencia artificial, habremos edificado la estructura técnica más alta de la historia. Sin embargo, al alcanzar la cúspide, constataremos la más absoluta soledad. No encontraremos allí presencia alguna; únicamente hallaremos el eco de nuestras propias palabras, reverberando en el vacío.

Rommel José Contreras Gaspar
Físico · Academia de GeoHistoria del Estado Sucre (AGHES)
Cumaná, Estado Sucre, 26 de mayo de 2026
Ensayo original · Publicado bajo licencia de divulgación académica.
📄 Descargar ensayo completo (PDF)

“Sin Dios y sin el otro, sin amor y sin carne” — Rommel Contreras (2026)

domingo, 24 de mayo de 2026

Guamacán: 5 km de incógnita bajo la montaña

🚇 TÚNEL DE TRASVASE "GUAMACÁN"
Actualizado al día 24 de mayo 2026

😳🤔 𝐀ú𝐧 𝐧𝐨 𝐬𝐚𝐛𝐞𝐦𝐨𝐬 𝐞𝐧 𝐪𝐮é 𝐜𝐨𝐧𝐝𝐢𝐜𝐢𝐨𝐧𝐞𝐬 se encuentrán 𝐚𝐩𝐫𝐨𝐱𝐢𝐦𝐚𝐝𝐚𝐦𝐞𝐧𝐭𝐞 ~5 𝐤𝐦 𝐝𝐞𝐥 𝐭ú𝐧𝐞𝐥 𝐆𝐮𝐚𝐦𝐚𝐜𝐚𝐧.

Si tomamos los datos proporcionados en la noticia anexa como progresiones lineales dentro del mismo eje del túnel (asumiendo que los 2.650 m y 5.480 m son avances desde extremos opuestos hacia el centro):

  • Longitud total conocida del túnel (Guamacán):13.200 metros
  • Avance desde el portal de entrada (Turimiquire): 2.650 m
  • Avance desde el portal de salida (Periquito): 5.480 m
  • 📐 Suma de avances: 2.650 m + 5.480 m = 8.130 metros

📐 𝐂á𝐥𝐜𝐮𝐥𝐨 𝐝𝐞𝐥 𝐭𝐫𝐚𝐦𝐨 𝐬𝐢𝐧 𝐞𝐱𝐩𝐥𝐨𝐫𝐚𝐫:

13.200 m (Total) − 8.130 m (Avances en ambos extremos) = 5.070 metros ⛰️

⛏️ 𝐑𝐞𝐬𝐩𝐞𝐜𝐭𝐨 𝐚𝐥 𝐏𝐞𝐫𝐟𝐢𝐥 𝐞𝐬𝐪𝐮𝐞𝐦á𝐭𝐢𝐜𝐨:

🧨 ¿Por qué ese tramo está "sin explorar" y cuál es su condición aproximada?

  • 🔻 Falta de ventilación natural: En el sector central (> 5 km de profundidad), el aire es irrespirable (CO₂, posible radón, polvo acumulado).
  • 💧 Potencial estancamiento de agua o lodo: Sin bombeo activo, filtraciones pueden haber generado grandes bolsones.
  • ⛰️ Presión litostática extrema: Bajo 1.200 m de roca (≈ entre 16 y 32 MPa), el túnel puede haber sufrido convergencias o derrumbes diferidos.
  • 📡 Sin instrumentación remota: Los sensores sólo se instalaron cerca de los frentes; la zona media es una "caja negra" geotécnica.
  • ⚠️ Riesgo de colapso o gases tóxicos: Entrar sin un plan especializado implica peligro de muerte. Por eso se declara "sin explorar".

📌 𝐍𝐨𝐭𝐚: La razón no es negligencia, sino seguridad industrial y geotécnica. Entrar a esa zona central sin un plan de ventilación, desagüe y monitoreo sería enviar un equipo a una muerte casi segura (por gases o derrumbe). Cualquier informe oficial que diga "se desconoce la condición del tramo central" es, paradójicamente, el informe más honesto y profesional que pueden dar. Además está la obstrucción aún sin resolver... (pero pudiera también existir negligencia ¿? o falta de apoyo desde el gob. central ). 30 años sin haber emprendido los correctivos suficientes y necesarios nos condujeron a esto


📰 𝐍𝐨𝐭𝐢𝐜𝐢𝐚 𝐅𝐮𝐞𝐧𝐭𝐞 🔗 facebook.com - Fuente de redes sociales 📅 fecha: 24 de mayo

🗣️💦 La gobernadora del estado Sucre Jhoanna Gabriela Carrillo Malavé a través de sus redes sociales informa:

"Desde el primer día, el Ministerio de Obras Públicas ha avanzado firmemente en la rehabilitación del túnel Guamacán. A la fecha, ya se cuentan con 3.5 kilómetros de iluminación continua, se han removido más de 2,000 metros cúbicos de sedimentos y se perforaron con éxito los primeros 7 metros de la obstrucción principal. ¡Día a día, el trabajo no se detiene!"
Juan Carlos Briceño

📝 Transcripción oficial de la declaración:

“Desde el día 1 avanzamos con paso firme en la rehabilitación del túnel Guamacán. Los Frentes de Trabajo reportan un progreso histórico en ambos extremos de la obra. En el portal de entrada, la intervención ya abarca desde el metro cero hasta los 2650 metros, mientras que el portal de salida se han desplegado hasta la progresiva 5.480. En total, 3.5 kilómetros cuentan con iluminación continua, 5.700 metros de manga se han instalado y más de 2.000 metros cúbicos de sedimentos se han removido. Además, se han perforado con éxito los primeros 7 metros de la obstrucción principal. Día a día, el trabajo no se detiene. Seguimos venciendo obstáculos.”

📌 Contexto: Este material forma parte del archivo documental sobre la crisis hídrica de Cumaná y el Sistema Turimiquire en 2026.

🚇 TÚNEL DE TRASVASE "GUAMACÁN" Croquis estructural · Tramo central sin explorar

⛏️ Perfil esquemático — basado en avances reportados (Turimiquire → 2.650 m | Periquito → 5.480 m) y longitud total estimada ~13.200 m
🚪 ENTRADA (Turimiquire) ⚙️ ZONA CENTRAL • SIN EXPLORAR ⚠️ 🚪 SALIDA (Periquito)
Avance entrada (2.650 m)
Avance salida (5.480 m)
TRAMO SIN EXPLORAR ≈ 4.450 – 5.070 m
✏️ Croquis explicativo: El túnel cruza la serranía de Turimiquire. Los avances conocidos suman 8.130 m, dejando un sector intermedio de ~4.450 a 5.070 metros sin explorar (geología, derrumbes, acumulación de gases o agua). La línea central se representa con patrón de interrogación.

📐 Longitud total estimada

≈ 13.200 m
(13.2 km) · Fuentes topográficas

⬅️ Avance ENTRADA (Turimiquire)

2.650 m
Progresiva desde el portal oeste

➡️ Avance SALIDA (Periquito)

5.480 m
Progresiva desde el portal este

⚠️ TRAMO INTERNO SIN EXPLORAR

~4.450 - 5.070 m
🔍 Estado: Desconocido (sin instrumentación / acceso)
🧱 Croquis basado en datos de campo + informes técnicos | Zona central (~4.450 - 5.070 m) permanece SIN EXPLORAR estructuralmente.

domingo, 10 de mayo de 2026

Las inteligencias artificiales alucinan

 𝙇𝙖 𝙄𝘼 𝙥𝙪𝙚𝙙𝙚 𝙖𝙘𝙚𝙡𝙚𝙧𝙖𝙧 𝙚𝙡 𝙥𝙚𝙣𝙨𝙖𝙢𝙞𝙚𝙣𝙩𝙤, 𝙥𝙚𝙧𝙤 𝙩𝙤𝙙𝙖𝙫í𝙖 𝙣𝙤 𝙨𝙪𝙨𝙩𝙞𝙩𝙪𝙮𝙚 𝙖𝙡 𝙥𝙚𝙣𝙨𝙖𝙢𝙞𝙚𝙣𝙩𝙤 𝙘𝙧í𝙩𝙞𝙘𝙤 [RJCG].


━━━━━━━━
⚠️ Es una de las razones —entre otras de mayor peso—, por las que tengo ganas de llamar a mi sistema experimental de IA: “𝕃𝕒𝕓𝕠𝕣𝕒𝕥𝕠𝕣𝕚𝕠 𝕕𝕖 𝕀𝔸: 𝔹𝕒𝕔𝕙𝕚𝕝𝕝𝕖𝕣 ℤ𝕖𝕣𝕡𝕒🤔
━━━━━━━━

No me refiero a ciencia ficción. En IA, “alucinación” significa que el sistema responde con seguridad sobre algo… aunque sea falso, incompleto o directamente inventado.

A veces son extravagantes en sus conclusiones, intentan responder aunque no sepan realmente la respuesta, y suelen proyectar una imagen de “omnisciencia”: parecen saber de todo —o al menos pretenden saberlo—. Pero no siempre distinguen bien entre lo probable y lo verdadero.

Además, son susceptibles a problemas bastante humanos: confabulación (rellenar vacíos con información plausible), sesgos, errores de contexto, exceso de confianza, e incluso una especie de “memoria imaginaria”, donde mezclan hechos ciertos con inferencias dudosas.

Lo fascinante es que, aun con esas limitaciones, son extraordinariamente útiles… siempre que se usen con criterio. Una IA no reemplaza el juicio humano: funciona mejor como un copiloto intelectual, no como un oráculo.

La regla de oro sigue siendo la misma: si una respuesta importa de verdad —científica, médica, histórica o técnica—, hay que verificarla.

La IA es extraordinaria condensando y organizando saberes; en eso posee una capacidad difícil de igualar. El problema no es cuánto “sabe”, sino cómo usa e interconecta ese conocimiento: ¿cómo emplea el contexto de lo que conoce para analizar algo nuevo y responder con criterio?

Y es precisamente allí —en el uso del contexto— donde aparece su mayor debilidad: la ausencia de juicio humano.

La IA no siente (al menos todavía no). Sería relativamente sencillo programarle un simulacro de emociones o un “falso sentimiento”, pero eso no equivale a experimentar miedo, duda, empatía o responsabilidad moral.

Le falta algo que, siguiendo el cogito cartesiano (pienso, luego existo), parece esencial en nosotros: la conciencia de sí como sujeto pensante. Las IA no existen —hasta ahora— como entes conscientes que piensan sobre su propio pensamiento; operan más bien como sistemas de inferencia probabilística.

Y aquí hay algo importante: un modelo de lenguaje (la categoría a la que pertenece la mayoría de las IA que usamos) no “sabe” las cosas del modo en que sabe un humano. Por potente que sea, funciona como una especie de sistema con amnesia estructural: conoce muchísimo del mundo… pero solo hasta la fecha de su entrenamiento, salvo que se conecte a fuentes externas.

Los LLM (Large Language Models), en esencia, son compresores estadísticos del lenguaje humano: han aprendido patrones inmensos de texto y calculan cuál es la siguiente idea, frase o relación más probable. Eso los hace brillantes muchas veces… pero también susceptibles a errores, alucinaciones y excesos de confianza.


Foto: Tomada del Facebook de LGGB

martes, 5 de mayo de 2026

Como hacer una búsqueda correcta en un RAG

🔎 Cómo diseñar búsquedas correctas en un sistema RAG optimizado

Un sistema de Retrieval-Augmented Generation (RAG) depende críticamente de la calidad de la consulta de entrada. En particular, la búsqueda vectorial pura presenta un punto ciego: funciona bien solo cuando el embedding de la pregunta es matemáticamente cercano al de los documentos almacenados.

Cuando la consulta contiene errores ortográficos, ambigüedad o mala estructura, el vector resultante se “desvía”, reduciendo significativamente la probabilidad de recuperar información relevante.

A continuación se presentan estrategias prácticas para mitigar este problema, especialmente en arquitecturas desplegadas en la Nube, sin exigir que el usuario formule preguntas perfectas. Esto es sugerido para los desarrolladores.


🧹 1. Filtro de limpieza (LLM Guard)

Antes de generar el embedding, es recomendable normalizar la consulta utilizando un modelo ligero. Este actúa como corrector ortográfico y semántico. 

Flujo:

Usuario → Worker (LLM corrector) → Embedding → Búsqueda vectorial
  

Prompt sugerido:

Eres un asistente de entrada. Reescribe la siguiente consulta 
corrigiendo errores ortográficos y mejorando la claridad, 
manteniendo el significado original. 
Responde solo con el texto corregido.
  

Modelos recomendados: llama-3.1-8b-instruct-fp8, llama-3.2-3b.


⚙️ 2. Búsqueda híbrida (Hybrid Search)

La práctica estándar en sistemas productivos es combinar múltiples estrategias de recuperación.

  • Búsqueda vectorial → similitud semántica
  • Búsqueda por texto → coincidencia exacta o parcial (por ejemplo, usando D1)

Ventaja:

  • Errores ortográficos → compensados por el vector
  • Términos técnicos exactos → capturados por búsqueda textual

Esta combinación reduce significativamente los falsos negativos.


🔤 3. Fuzzy Search y normalización

Cuando no se desea incorporar un LLM adicional (por costo o latencia), se puede mejorar la robustez mediante técnicas clásicas:

  • Fuzzy Matching: uso de distancia de Levenshtein para aproximar términos.
    Ejemplo: fisca → física
  • Normalización:
    • Convertir a minúsculas
    • Eliminar acentos
    • Unificar formato antes del embedding

Es fundamental que la base vectorial haya sido indexada con las mismas reglas de normalización.


🧠 4. El problema del “ruido” en embeddings

Los modelos de embeddings son altamente sensibles a la estructura de la oración.

Ejemplo:

  • ✔️ Consulta estructurada:
    ¿Cuál es el coeficiente de dilatación del concreto?
  • Consulta ruidosa:
    concreto… eso de la dilatación cuánto es?

En el segundo caso, el vector se degrada debido a palabras irrelevantes o ambiguas.


🚀 5. Expansión de consulta (Query Expander)

Una estrategia avanzada consiste en transformar la pregunta del usuario en una consulta más técnica y precisa antes de generar el embedding.

Ejemplo:

Entrada del usuario:
"¿cómo va lo del túnel roto?"

Consulta expandida:
"Análisis estructural y colapso de túneles en Sucre"
  

Esta técnica mejora la calidad del vector y aumenta la probabilidad de recuperar documentos relevantes.


🧩 Conclusión

Un RAG eficiente no depende únicamente del modelo de lenguaje, sino de la calidad del pipeline de consulta.

  • 🧹 Limpieza previa de entrada
  • ⚙️ Recuperación híbrida
  • 🔤 Normalización y tolerancia a errores
  • 🚀 Expansión semántica

flowchart TD A[👤 Usuario
Consulta cruda] --> B[🧹 Preprocesamiento
Normalización + limpieza] B --> C{¿Usar LLM Guard?} C -->|Sí| D[🤖 LLM Corrector
Reescritura semántica] C -->|No| E[➡️ Consulta directa] D --> F[🚀 Query Expander
Optimización semántica] E --> F F --> G[🧠 Generación de Embedding] G --> H1[🔎 Vector Search
Cloudflare Vectorize] F --> H2[📚 Keyword Search
D1 / SQL] H1 --> I[📦 Resultados vectoriales] H2 --> I2[📦 Resultados textuales] I --> J[⚖️ Fusión / Ranking] I2 --> J J --> K[📄 Contexto relevante] K --> L[🤖 LLM Generador
Respuesta final] L --> M[💬 Respuesta al usuario]

Implementadas correctamente, estas técnicas permiten construir sistemas que toleran ambigüedad humana y aún así producen respuestas de alta calidad.

Referencia: 


domingo, 3 de mayo de 2026

El cubo de Rubik

🧊 Grupo del Cubo de Rubik (3×3×3)

Sea G el grupo de configuraciones del cubo de Rubik 3×3×3. Se trata de un grupo finito que describe todas las posiciones alcanzables mediante movimientos legales del cubo.

📐 Estructura del grupo

  • 🔢 Orden: 43,252,003,274,489,856,000 configuraciones posibles.
  • ⚙️ Naturaleza: G no es el grupo de simetrías geométricas del cubo, sino el grupo generado por movimientos (giros de caras).
  • 🧩 Estructura algebraica: se describe mediante productos semidirectos que combinan:
    • Permutaciones de esquinas y aristas
    • Orientaciones de piezas (torsión y volteo)
  • 🔄 Acción del grupo: G actúa sobre las piezas mediante permutaciones y cambios de orientación.

⚠️ Aclaración importante

El grupo del cubo de Rubik no es isomorfo a S₄ × C₃ × C₃ × C₃. Esa expresión es una simplificación incorrecta. La estructura real incorpora restricciones globales de paridad y orientación.

🔬 Interpretación algebraica

Desde el punto de vista algebraico, G puede modelarse como un grupo de permutaciones con restricciones:

  • 🧠 Esquinas con orientación en ℤ₃
  • 🔁 Aristas con orientación en ℤ₂
  • ⚖️ Invariantes globales: paridad y suma de orientaciones

📚 Relación con teoría de Galois (visión conceptual)

De forma análoga, puede verse G como un grupo que actúa sobre un sistema estructurado, preservando relaciones internas entre sus elementos.

  • 🧩 Las configuraciones juegan el rol de “campo”
  • 🔄 Los movimientos actúan como “automorfismos”
  • ⚙️ Las invariantes reflejan restricciones algebraicas

⚠️ Esta analogía es conceptual, no una equivalencia formal en el sentido clásico de la teoría de Galois.

🧠 Conclusión

  • 🧮 Integra geometría y álgebra discreta
  • 🔍 Permite estudiar simetrías e invariantes
  • ⚙️ Es un modelo concreto de sistemas algebraicos complejos

En conjunto, G muestra cómo un sistema aparentemente simple puede contener una estructura matemática profundamente sofisticada.


Referencias:

viernes, 1 de mayo de 2026

¡ 𝐍𝐎 𝐇𝐀𝐘 𝐋𝐔𝐙 𝐄𝐍 𝐄𝐋 𝐓Ú𝐍𝐄𝐋 !

60 día luego de la Crisis Hídrica de Cumaná:




0:07
Es que el problema de la crisis es tan profunda y tan grande que aquí debería haber una estrategia para la crisis. Yo entiendo que la gobernación, la alcaldía, han hecho diligencias, sino no hubieran recuperado cancamure ni se hubiera recuperado mochimita, si no, no tuvieran una cisterna haciendo el trabajo allá en los chaima, pusieron unos tanques plásticos. Lo que yo no he visto es una campaña educativa y efectiva para entrenar a la población en esta crisis.
0:36
Yo no he visto que se haya ayudado a la familia con pequeños, yo pasé antier por detrás de la policía, la gente que vive ahí en esa calle, calle, eso se llama río viejo, boca el lobo sacando botecito, botellita, vainita para agarrar el agua, la familia de una cisterna de 30000 L. Las familias necesitan por lo menos tambores de 200 L metálico, aunque sea lo que sea, porque tenemos que.
1:04
Darle una estabilidad a la crisis y hay que donárselo cuando el problema de cumanacoa se le dio a la gente bono, bueno, pero es que el problema aquí yo no, yo no. Yo creo que que posiblemente en el Parcelamiento no sea tan agudo la cuestión del tanque, pero en los barrios la gente no está acostumbrada a tener tanque ni en ni ese tipo de reservorio. Entonces el Estado debería establecer una partida, una campaña agresiva de educación, de suministro.
1:32
Las pastillas son buenas, como decía Fariña, Hervirla no te va a matar, etcétera, etcétera. El agua, lo que no se puede tomar por mucho tiempo, es destilada, porque necesita los minerales, los minerales los necesita. El agua potable no es exactamente un agua destilada ni nada que ver. Es un agua mineralizada, con cierta turbidez y con cierta y con ciertos parámetros físicos y químicos, pero no biológicos.
2:01
El agua potable no tiene bacterias ni tiene virus. Exacto, hay una técnica de salud China milenaria que agarran orine y eses y le echan al agua que toma. ¿Por qué para recuperar la flora bacteriana? Pero esos no estamos. En este caso a los enfermos graves les agarran de su mismo pupú y les ponen en el agua. A Tómate esa vaina porque ahí van las bacterias que necesita revitalizar, pero no estamos en esa situación, ahorita tenemos que tomar el agua potable.
2:31
Ya voy, ya voy, ya voy en un solo minuto, pero un minutico y respondo a este te doy, ya voy. Entonces que yo creo que la solución de la del del Estado venezolano se quedó corto engatillado mandaron ayuda. Si alguien está trabajando en el túnel, no tengo los detalles exactos del túnel, pero ya les hice un panorama, pero el túnel es un problema, el otro problema es la ciudad, la gente y ese no se ha atendido.
3:02
La gobernación, mira, haga lo que haga, no puede parir un río. La alcaldía menos tiene, menos recursos no tiene. O sea, lo podemos criticar, lo podemos vilipendiar, pero ellos por sí solos no pueden resolver la crisis de agua. La única potencia que tenemos sobre la gobernación y la alcaldía es el Estado venezolano, que posiblemente tampoco puede hacer magia.
3:30
Pero mucho puede ayudar aquí. Tenemos que activar a la milicia, a los cuerpos de Defensa Civil, entrenar lo que ya perdimos 60 días, pero vienen 60 o 90 días más, porque es que no hay, no hay, cómo se dice, no hay luz en el túnel. ¿Sabes qué es eso? Que no veo la otra boca ,Y no es una cuestión de días, ni de horas ni de semana, es una cuestión de meses.
4:00
Y hay familias que están al borde de la locura. Aquí en el centro histórico hay un pintor que que que de verdad que el señor está mal. Él esta mañana puso un mensaje, "no encuentro que hacer todos los días con esta agonía, el agua", porque mira, a mí me ha sido muy fácil esta crisis, yo tengo 3 Aires acondicionados, prendido todo el día en la Casa mientras haya luz. Ajá. Pero no todo El Mundo tiene aire, no todo El Mundo le llega la cisterna, no a todo El Mundo le ha llegado agua.
4:29
¿No todo El Mundo puede cargar el agua porque incluso el agua pudiera estar al otro lado de la calle, y ahí yo conozco en el edificio, señoras que no pueden levantar un bote de 5 L, entonces tenemos que ayudar a quién? Una persona de 64 años como yo, no jóvenes, milicianos, el Ejército, la ciudad tiene que ser tomada por una autoridad única, distribuir agua potable, enseñarnos a cuidar la que tenemos.
4:57
Enseñarnos a bañarnos, incluso reentrenarnos para la crisis, la crisis se atiende con energías y propuestas.
Nota: Fragmento del Conversatorio, orgranizado por La Academia de Geohistoria del Estado Sucre (AGHES); ¨ El problema histório del agua en Cumaná ¨ a cargo de Rommel Contreras. Esta actividad se realizaró el jueves 30 de abril de 2026 a las 10 am, en la Casa de la Diversidad Cultural. Reafirmación de la Independencia, Identidad y Soberanía de Venezuela. Venezuela: Patria de Libertadores

miércoles, 29 de abril de 2026

Experimento sobre Consulta RAG

 Mi experimento sobre Consulta RAG: Sistema Hídrico de Cumaná

La búsqueda en un mar de ideas...

En las últimos días he estado construyendo un sistema de consulta basado en mis investigaciones de geohistoria de Cumaná —específicamente sobre el colapso del Túnel de Trasvase Guamacán y la crisis hídrica que afecta a Cumaná y otras ciudades del oriente venezolano.

🔗 https://url_url_url/consulta-rag   (solicitar al autor el enlace de prueba)

El sistema utiliza como modelo de inferencia Llama 3.3 70B (modelo de lenguaje de gran escala, ~70 mil millones de parámetros, optimizado para comprensión profunda, razonamiento contextual y generación de texto complejo) y como modelo de embeddings Qwen3-Embedding-0.6B (modelo especializado en representación semántica de texto, optimizado para búsqueda por similitud, clustering y recuperación de información), con almacenamiento en una base de datos vectorial.

Los modelos LLM (Large Language Models) son, en esencia, compresores estadísticos del lenguaje humano. Durante el entrenamiento, ajustan miles de millones (o billones, en escala anglosajona) de parámetros para minimizar la perplejidad () sobre grandes volúmenes de texto.

El resultado es una red neuronal que ha interiorizado patrones sintácticos, semánticos y factuales —lo que, en términos prácticos, podemos llamar conocimiento—. Sin embargo, ese conocimiento queda congelado en los pesos del modelo desde el momento del entrenamiento.

La técnica de RAG (Retrieval-Augmented Generation) aborda este problema de raíz: en lugar de pedirle al modelo que “recuerde”, se le proporcionan fragmentos relevantes extraídos de una base documental. El modelo deja de comportarse como un oráculo y pasa a ser un lector experto capaz de sintetizar evidencia concreta.

  • La búsqueda semántica en el espacio vectorial no busca palabras exactas: busca proximidad de significado.
  • Dos frases que no comparten una sola palabra pueden estar muy próximas en ese espacio si expresan la misma idea.
  • Esto es recuperación de información por similitud conceptual, no por coincidencia léxica. Y es precisamente lo que permite que un sistema responda preguntas sobre documentos utilizando formulaciones que esos mismos documentos nunca emplearon.
  • El vector no es el texto: es la huella semántica del texto en un espacio matemático donde la distancia representa significado. Buscar en ese espacio es buscar ideas, no palabras.

 Perplejidad (perplexity): métrica que cuantifica la incertidumbre del modelo al predecir el siguiente token en una secuencia. Un modelo con perplejidad 10 se comporta, estadísticamente, como si eligiera entre 10 opciones equiprobables en cada paso.


PD: Agradezco sus comentarios luego de probar el sistema, con el fin de mejorar su comportamiento base. Para obtener mejores resultados, es recomendable formular preguntas de manera precisa y con buena ortografía.


~ Agradezco no re-enviar el enlace ~


lunes, 27 de abril de 2026

Escaneo de documentos con Google Drive

Hice unas notas manuscritas -rápidas- en una hoja tamaño carta. Sin cuidar nada... solo notas para esbozar ideas, luego utilicé la aplicación de Google Drive para escanear esa hoja... que por allí andaba suelta en el escritorio. 


Hoja original escaneada

La utilidad de Google Drive, permitió usar la cámara del teléfono, convirtió la imagen en PDF, permitió asignarle un nombre, filtrarla etc. y la almacenó en mi espacio de Drive.


En Drive, ahora puedo ver o desacargar el PDF (558 kB) del manuscrito, pero además puedo utilizar Gemini para tener información sobre este archivo 💥, y puedo usar la barra de búsqueda para localizar ese documento o cualqueir palabra contenida en él:
📄

Documento base del sistema

Nombre del archivo: testArchivo_escaneado_20260427-1751.pdf

📌 Contiene una lista de componentes o funciones relacionadas con un sistema de infraestructura o proyecto informático, posiblemente en el contexto de aprendizaje automático (Machine Learning) o procesamiento de datos.

⬇️ A continuación se detalla el análisis extraído del PDF ⬇️

🧠 Estado del “Cerebro Distribuido” (IA Edge)

Infraestructura híbrida con nombres locales - actualización técnica

🍚

Cluster Rice-PI Tau x 7D

Estado: “2 procesadow” (dos veces procesado).

📱

Nodo de Inferencia – Clasificador WhatsApp

TensorFlow Lite • ARM Cortex-A7 (32-bit, doble núcleo).

🚪

Gateway MGLTT

ARM M4 (200MHz) • Ubuntu 22.04 • 512 MB DDR3L + eMMC 4GB. Para sistema de Robots Clasificadores.

🌊

App Flask en Cubagua

Requiere que el Pico-Pi actúe como buffer de protocolos.

🗄️

Cache Mini Local “Edge Stone”

eMMC de 4GB • Cache de artefactos frecuentes (modelos pequeños / embeddings).

🔄

ETL Pipeline – Repeater Curabituries

~1900 reports procesados → datasets agregados.

🔢

Servidor de Embeddings Locales

Sentence Transformers API – vectores comparables a OpenAI.

📊

Monitor de Salud

Prometheus Node Exporter. Picos-PI reportan métricas a Cubagua y Trailer Nagasaki.

⚙️

CI/CD Runner Ligero

Cortex-Action Runner – ejecuta tareas Pyro semanalmente.

🧩 “Cerebro Distribuido” para IA

  • Cubagua → PostgreSQL en “Palata” (base de datos).
  • Nagasaki → Nodo de inferencia (interpreta).
  • Modelo de lenguaje grande + Orquestador: Frailes, el bibliotecario.

🧠 El clúster opera con nombres locales: Cubagua, Nagasaki, Frailes, Palata, Pico-Pi y más.

ComponenteEspecificaciones / Rol
Gateway MGLTTARM M4 (200MHz) • Ubuntu 22.04 • 512MB DDR3L + eMMC 4GB
Cache Edge StoneeMMC 4GB (artefactos frecuentes)
Clasificador WhatsAppARM Cortex-A7 32-bit (doble núcleo) + TensorFlow Lite
Prometheus + Picos-PIMétricas hacia Cubagua y Trailer Nagasaki

🧪 Reporte técnico - Infraestructura distribuida (actualización automática)

viernes, 24 de abril de 2026

Optimización del servicio de agua en Cumaná

Sistema RAG: Optimización del servicio de agua en Cumaná

🤖 Análisis sobre el servicio de agua en Cumaná

Recuperación Aumentada por Generación aplicada a problemáticas locales

Un ejercicio académico del Laboratorio de IA de RJCG [Sistema RAG]

💬 Pregunta planteada al sistema

¿Cómo pudiéramos optimizar el servicio de agua de Cumaná?

⏱️ Tiempo de procesamiento: 19.55 segundos (GPU Google T4)

📋 Respuesta generada por el sistema RAG

Una pregunta interesante y relevante para una ciudad como Cumaná, que enfrenta desafíos en la gestión del agua.

Para optimizar el servicio de agua de Cumaná, se podrían considerar las siguientes acciones:

  1. Mejorar la eficiencia en la gestión del agua: Implementar sistemas de seguimiento y monitoreo para detectar pérdidas de agua y tomar medidas para reducirlas.
  2. Inversión en infraestructura: Aumentar la capacidad de almacenamiento de agua, mejorar la red de distribución y reparar fugas en los sistemas de riego.
  3. Fortalecer la gestión de fuentes: Proteger y administrar las fuentes naturales de agua de Cumaná, como el río Manzanares y los caños urbanos, para garantizar su disponibilidad futura.
  4. Promover la conservación del agua: Educación y conciencia ciudadana sobre la importancia de la gestión eficiente del agua, fomentando hábitos de ahorro y uso responsable.
  5. Investigación e innovación: Fomentar la investigación y el desarrollo de tecnologías y métodos para mejorar la eficiencia en la gestión del agua y la protección de las fuentes naturales.
  6. Colaboración entre instituciones: Fortalecer la cooperación entre la C.A Hidrológica del Caribe (HIDROCARIBE), el gobierno local, la comunidad y otros actores relevantes para abordar los desafíos en la gestión del agua de manera coordinada.
  7. Desarrollo de planes y políticas: Crear planes y políticas claras para la gestión sostenible del agua en Cumaná, que incluyan metas específicas, indicadores de seguimiento y responsabilidades asignadas a los diferentes actores involucrados.

Al implementar estas acciones, se podría optimizar el servicio de agua en Cumaná y garantizar una disponibilidad segura y sostenible para las generaciones futuras.

📚 Documentos consultados por el sistema

  • informacion_A-P_Sucre_Oeste.pdf
  • Las_arterias_olvidadas_de_Cumaná_2026.pdf
  • Resumen_BID_alcaldía.pdf

⚙️ Modelos y parámetros utilizados en este sistema RAG

Para el sistema de Recuperación Aumentada por Generación (RAG) implementado, se han utilizado dos modelos clave a través de la plataforma Ollama:

1️⃣ Modelo de Embedding: nomic-embed-text

  • Función: Este modelo es el encargado de transformar tanto los documentos de referencia (los PDFs cargados) como las consultas del usuario en representaciones numéricas (vectores o embeddings). Estos vectores capturan el significado semántico del texto.
  • Importancia: Permite al sistema encontrar rápidamente los fragmentos de texto más relevantes de tu base de conocimientos que son semánticamente similares a la pregunta del usuario. Sin un buen modelo de embedding, la recuperación de información sería ineficaz.
  • Parámetros: Al ser un modelo pre-entrenado, su arquitectura y pesos internos son fijos. Los parámetros principales son la dimensión del espacio vectorial de los embeddings (determinada por el modelo), y cómo se manejan los "chunks" (fragmentos de texto) que se configuran en el RecursiveCharacterTextSplitter.

2️⃣ Modelo de Inferencia (LLM): llama3.1

  • Función: Una vez que el nomic-embed-text ha recuperado el contexto más relevante, el modelo llama3.1 entra en acción. Su tarea es leer la pregunta del usuario y el contexto recuperado para generar una respuesta coherente, relevante y con el tono especificado en el SYSTEM_PROMPT.
  • Importancia: llama3.1 es un modelo de lenguaje grande (LLM) de Meta, conocido por su capacidad de razonamiento y generación de texto de alta calidad. Su uso asegura que la respuesta final no solo sea precisa (basada en el contexto), sino también bien redactada y fácil de entender.
  • Parámetros: Como LLM, tiene millones o miles de millones de parámetros entrenados. En este caso, se invoca con la configuración por defecto proporcionada por Ollama para llama3.1, que ya está optimizada para buen rendimiento y calidad. Otros parámetros comunes para los LLMs incluyen la temperatura (creatividad de la respuesta), top_p (muestreo de tokens), etc., aunque aquí se utilizan los valores predeterminados de la implementación de LangChain/Ollama.
🔄 Flujo del RAG: La combinación de nomic-embed-text para una recuperación precisa y llama3.1 para una generación inteligente permite que el sistema RAG responda preguntas complejas utilizando información propia y local, superando las limitaciones de conocimiento de un LLM base y proporcionando respuestas fundamentadas en a partir de un conjunto de documentos.

💡 ¿Qué es una GPU T4 de Google (el recurso de hardware utilizado para la inferencia)?

Una GPU (Unidad de Procesamiento Gráfico) T4 de Google, a menudo conocida simplemente como NVIDIA T4, es una tarjeta aceleradora diseñada por NVIDIA y optimizada para su uso en centros de datos, especialmente en cargas de trabajo de inferencia de aprendizaje profundo y computación de alto rendimiento (HPC). Google Cloud Platform ofrece estas GPUs como parte de sus instancias de máquina virtual para que los usuarios puedan aprovechar su potencia de procesamiento paralelo.

Características clave de las NVIDIA T4:

  • Arquitectura Turing: Están basadas en la arquitectura NVIDIA Turing, que incorpora núcleos Tensor de nueva generación y núcleos RT para inteligencia artificial y renderizado en tiempo real.
  • Rendimiento de IA: Son particularmente potentes para tareas de inferencia (es decir, usar un modelo de IA entrenado para hacer predicciones) debido a sus núcleos Tensor, que aceleran las operaciones matriciales.
  • Eficiencia energética: Están diseñadas para ser muy eficientes energéticamente, lo que las hace adecuadas para implementaciones a gran escala en la nube.
  • Flexibilidad: Pueden manejar una variedad de cargas de trabajo, incluyendo inferencia, entrenamiento de IA a menor escala, análisis de datos y procesamiento de gráficos.

En resumen, una GPU T4 de Google se refiere a la NVIDIA T4 que Google pone a disposición en su infraestructura en la nube para potenciar aplicaciones de IA y HPC.

Páginas

Entrada destacada

Sin Dios y sin el otro, sin amor y sin carne

Sin Dios y sin el otro, sin amor y sin carne | Rommel Contreras Sin Dios y sin el...

Entradas populares

Visitas: