viernes, 1 de mayo de 2026

¡ 𝐍𝐎 𝐇𝐀𝐘 𝐋𝐔𝐙 𝐄𝐍 𝐄𝐋 𝐓Ú𝐍𝐄𝐋 !

60 día luego de la Crisis Hídrica de Cumaná:




0:07
Es que el problema de la crisis es tan profunda y tan grande que aquí debería haber una estrategia para la crisis. Yo entiendo que la gobernación, la alcaldía, han hecho diligencias, sino no hubieran recuperado cancamure ni se hubiera recuperado mochimita, si no, no tuvieran una cisterna haciendo el trabajo allá en los chaima, pusieron unos tanques plásticos. Lo que yo no he visto es una campaña educativa y efectiva para entrenar a la población en esta crisis.
0:36
Yo no he visto que se haya ayudado a la familia con pequeños, yo pasé antier por detrás de la policía, la gente que vive ahí en esa calle, calle, eso se llama río viejo, boca el lobo sacando botecito, botellita, vainita para agarrar el agua, la familia de una cisterna de 30000 L. Las familias necesitan por lo menos tambores de 200 L metálico, aunque sea lo que sea, porque tenemos que.
1:04
Darle una estabilidad a la crisis y hay que donárselo cuando el problema de cumanacoa se le dio a la gente bono, bueno, pero es que el problema aquí yo no, yo no. Yo creo que que posiblemente en el Parcelamiento no sea tan agudo la cuestión del tanque, pero en los barrios la gente no está acostumbrada a tener tanque ni en ni ese tipo de reservorio. Entonces el Estado debería establecer una partida, una campaña agresiva de educación, de suministro.
1:32
Las pastillas son buenas, como decía Fariña, Hervirla no te va a matar, etcétera, etcétera. El agua, lo que no se puede tomar por mucho tiempo, es destilada, porque necesita los minerales, los minerales los necesita. El agua potable no es exactamente un agua destilada ni nada que ver. Es un agua mineralizada, con cierta turbidez y con cierta y con ciertos parámetros físicos y químicos, pero no biológicos.
2:01
El agua potable no tiene bacterias ni tiene virus. Exacto, hay una técnica de salud China milenaria que agarran orine y eses y le echan al agua que toma. ¿Por qué para recuperar la flora bacteriana? Pero esos no estamos. En este caso a los enfermos graves les agarran de su mismo pupú y les ponen en el agua. A Tómate esa vaina porque ahí van las bacterias que necesita revitalizar, pero no estamos en esa situación, ahorita tenemos que tomar el agua potable.
2:31
Ya voy, ya voy, ya voy en un solo minuto, pero un minutico y respondo a este te doy, ya voy. Entonces que yo creo que la solución de la del del Estado venezolano se quedó corto engatillado mandaron ayuda. Si alguien está trabajando en el túnel, no tengo los detalles exactos del túnel, pero ya les hice un panorama, pero el túnel es un problema, el otro problema es la ciudad, la gente y ese no se ha atendido.
3:02
La gobernación, mira, haga lo que haga, no puede parir un río. La alcaldía menos tiene, menos recursos no tiene. O sea, lo podemos criticar, lo podemos vilipendiar, pero ellos por sí solos no pueden resolver la crisis de agua. La única potencia que tenemos sobre la gobernación y la alcaldía es el Estado venezolano, que posiblemente tampoco puede hacer magia.
3:30
Pero mucho puede ayudar aquí. Tenemos que activar a la milicia, a los cuerpos de Defensa Civil, entrenar lo que ya perdimos 60 días, pero vienen 60 o 90 días más, porque es que no hay, no hay, cómo se dice, no hay luz en el túnel. ¿Sabes qué es eso? Que no veo la otra boca ,Y no es una cuestión de días, ni de horas ni de semana, es una cuestión de meses.
4:00
Y hay familias que están al borde de la locura. Aquí en el centro histórico hay un pintor que que que de verdad que el señor está mal. Él esta mañana puso un mensaje, "no encuentro que hacer todos los días con esta agonía, el agua", porque mira, a mí me ha sido muy fácil esta crisis, yo tengo 3 Aires acondicionados, prendido todo el día en la Casa mientras haya luz. Ajá. Pero no todo El Mundo tiene aire, no todo El Mundo le llega la cisterna, no a todo El Mundo le ha llegado agua.
4:29
¿No todo El Mundo puede cargar el agua porque incluso el agua pudiera estar al otro lado de la calle, y ahí yo conozco en el edificio, señoras que no pueden levantar un bote de 5 L, entonces tenemos que ayudar a quién? Una persona de 64 años como yo, no jóvenes, milicianos, el Ejército, la ciudad tiene que ser tomada por una autoridad única, distribuir agua potable, enseñarnos a cuidar la que tenemos.
4:57
Enseñarnos a bañarnos, incluso reentrenarnos para la crisis, la crisis se atiende con energías y propuestas.
Nota: Fragmento del Conversatorio, orgranizado por La Academia de Geohistoria del Estado Sucre (AGHES); ¨ El problema histório del agua en Cumaná ¨ a cargo de Rommel Contreras. Esta actividad se realizaró el jueves 30 de abril de 2026 a las 10 am, en la Casa de la Diversidad Cultural. Reafirmación de la Independencia, Identidad y Soberanía de Venezuela. Venezuela: Patria de Libertadores

miércoles, 29 de abril de 2026

Experimento sobre Consulta RAG

 Mi experimento sobre Consulta RAG: Sistema Hídrico de Cumaná

La búsqueda en un mar de ideas...

En las últimos días he estado construyendo un sistema de consulta basado en mis investigaciones de geohistoria de Cumaná —específicamente sobre el colapso del Túnel de Trasvase Guamacán y la crisis hídrica que afecta a Cumaná y otras ciudades del oriente venezolano.

🔗 https://url_url_url/consulta-rag   (solicitar al autor el enlace de prueba)

El sistema utiliza como modelo de inferencia Llama 3.3 70B (modelo de lenguaje de gran escala, ~70 mil millones de parámetros, optimizado para comprensión profunda, razonamiento contextual y generación de texto complejo) y como modelo de embeddings Qwen3-Embedding-0.6B (modelo especializado en representación semántica de texto, optimizado para búsqueda por similitud, clustering y recuperación de información), con almacenamiento en una base de datos vectorial.

Los modelos LLM (Large Language Models) son, en esencia, compresores estadísticos del lenguaje humano. Durante el entrenamiento, ajustan miles de millones (o billones, en escala anglosajona) de parámetros para minimizar la perplejidad () sobre grandes volúmenes de texto.

El resultado es una red neuronal que ha interiorizado patrones sintácticos, semánticos y factuales —lo que, en términos prácticos, podemos llamar conocimiento—. Sin embargo, ese conocimiento queda congelado en los pesos del modelo desde el momento del entrenamiento.

La técnica de RAG (Retrieval-Augmented Generation) aborda este problema de raíz: en lugar de pedirle al modelo que “recuerde”, se le proporcionan fragmentos relevantes extraídos de una base documental. El modelo deja de comportarse como un oráculo y pasa a ser un lector experto capaz de sintetizar evidencia concreta.

  • La búsqueda semántica en el espacio vectorial no busca palabras exactas: busca proximidad de significado.
  • Dos frases que no comparten una sola palabra pueden estar muy próximas en ese espacio si expresan la misma idea.
  • Esto es recuperación de información por similitud conceptual, no por coincidencia léxica. Y es precisamente lo que permite que un sistema responda preguntas sobre documentos utilizando formulaciones que esos mismos documentos nunca emplearon.
  • El vector no es el texto: es la huella semántica del texto en un espacio matemático donde la distancia representa significado. Buscar en ese espacio es buscar ideas, no palabras.

 Perplejidad (perplexity): métrica que cuantifica la incertidumbre del modelo al predecir el siguiente token en una secuencia. Un modelo con perplejidad 10 se comporta, estadísticamente, como si eligiera entre 10 opciones equiprobables en cada paso.


PD: Agradezco sus comentarios luego de probar el sistema, con el fin de mejorar su comportamiento base. Para obtener mejores resultados, es recomendable formular preguntas de manera precisa y con buena ortografía.


~ Agradezco no re-enviar el enlace ~


Anexo: Como hacer una búsqueda correcta en un RAG optimizado:

Precisamente el "punto ciego" de la búsqueda vectorial pura depende de la pregunta. Cuando usas vectores, el sistema depende de que el Embedding de tu pregunta se parezca matemáticamente al del documento. Si hay errores ortográficos o la estructura es pobre, el modelo de embeddings genera un vector "desviado", lo que te aleja de la información correcta en tu base de datos.

Aquí están tres estrategias técnicas que puedes aplicar en una capa de Cloudflare para solucionar esto sin obligar al usuario a escribir perfecto:


1. El "Filtro de Limpieza" (LLM Guard)

Antes de enviar la pregunta a tu base de datos vectorial (Vectorize), pásala por un modelo pequeño y rápido como llama-3.2-3b. Pídele que actúe como un corrector de estilo.

  • Flujo: Pregunta del usuario $\rightarrow$ Worker (LLM Corrector) $\rightarrow$ Embedding $\rightarrow$ Búsqueda Vectorial.

  • Prompt sugerido: "Eres un asistente de entrada. Reescribe la siguiente consulta para corregir errores ortográficos y mejorar la claridad, manteniendo el significado original. Solo entrega el texto corregido."


2. Implementar Búsqueda Híbrida (Hybrid Search)

Esta es la solución estándar en la industria. No confíes solo en el vector.

  • Cómo funciona: Buscas simultáneamente por el vector y por palabras clave (usando texto plano en tu base de datos D1).

  • Por qué ayuda: Si el usuario escribe mal una palabra pero el resto de la oración es clara, el vector lo compensa. Si el usuario escribe una palabra técnica exacta pero con mala gramática, la búsqueda de texto la encuentra.


3. Uso de N-Grams o "Fuzzy Search"

Si no quieres usar un LLM para corregir (por ahorrar neuronas), puedes usar lógica de programación en tu Worker:

  • Fuzzy Matching: Utiliza algoritmos como la Distancia de Levenshtein para comparar palabras. Si el usuario escribe "fisca", el sistema entiende que probablemente quiso decir "física".

  • Normalización: Convierte siempre la entrada a minúsculas y elimina acentos antes de generar el embedding, asegurándote de que tu base de datos vectorial haya sido indexada con esa misma limpieza.


4. El problema del "Ruido" en los Embeddings

Los modelos de embeddings son muy sensibles al orden de las palabras.

  • Oración bien estructurada: "¿Cuál es el coeficiente de dilatación del concreto?" $\rightarrow$ Vector muy preciso.

  • Oración pobre: "concreto... eso de la dilatación cuanto es?" $\rightarrow$ El vector se "ensucia" con las palabras de relleno.

¿Qué puedes hacer en Cloudflare?

Como ya tienes un RAG funcionando, te recomiendo implementar un "Query Expander".

Usa un Worker para transformar la pregunta del usuario en una "búsqueda ideal". Por ejemplo, si el usuario pregunta: "¿cómo va lo del túnel roto?", el Worker lo expande a: "Análisis estructural y colapso de túneles en Sucre". Ese nuevo texto generará un vector mucho más potente para buscar en tu base de datos.


lunes, 27 de abril de 2026

Escaneo de documentos con Google Drive

Hice unas notas manuscritas -rápidas- en una hoja tamaño carta. Sin cuidar nada... solo notas para esbozar ideas, luego utilicé la aplicación de Google Drive para escanear esa hoja... que por allí andaba suelta en el escritorio. 


Hoja original escaneada

La utilidad de Google Drive, permitió usar la cámara del teléfono, convirtió la imagen en PDF, permitió asignarle un nombre, filtrarla etc. y la almacenó en mi espacio de Drive.


En Drive, ahora puedo ver o desacargar el PDF (558 kB) del manuscrito, pero además puedo utilizar Gemini para tener información sobre este archivo 💥, y puedo usar la barra de búsqueda para localizar ese documento o cualqueir palabra contenida en él:
📄

Documento base del sistema

Nombre del archivo: testArchivo_escaneado_20260427-1751.pdf

📌 Contiene una lista de componentes o funciones relacionadas con un sistema de infraestructura o proyecto informático, posiblemente en el contexto de aprendizaje automático (Machine Learning) o procesamiento de datos.

⬇️ A continuación se detalla el análisis extraído del PDF ⬇️

🧠 Estado del “Cerebro Distribuido” (IA Edge)

Infraestructura híbrida con nombres locales - actualización técnica

🍚

Cluster Rice-PI Tau x 7D

Estado: “2 procesadow” (dos veces procesado).

📱

Nodo de Inferencia – Clasificador WhatsApp

TensorFlow Lite • ARM Cortex-A7 (32-bit, doble núcleo).

🚪

Gateway MGLTT

ARM M4 (200MHz) • Ubuntu 22.04 • 512 MB DDR3L + eMMC 4GB. Para sistema de Robots Clasificadores.

🌊

App Flask en Cubagua

Requiere que el Pico-Pi actúe como buffer de protocolos.

🗄️

Cache Mini Local “Edge Stone”

eMMC de 4GB • Cache de artefactos frecuentes (modelos pequeños / embeddings).

🔄

ETL Pipeline – Repeater Curabituries

~1900 reports procesados → datasets agregados.

🔢

Servidor de Embeddings Locales

Sentence Transformers API – vectores comparables a OpenAI.

📊

Monitor de Salud

Prometheus Node Exporter. Picos-PI reportan métricas a Cubagua y Trailer Nagasaki.

⚙️

CI/CD Runner Ligero

Cortex-Action Runner – ejecuta tareas Pyro semanalmente.

🧩 “Cerebro Distribuido” para IA

  • Cubagua → PostgreSQL en “Palata” (base de datos).
  • Nagasaki → Nodo de inferencia (interpreta).
  • Modelo de lenguaje grande + Orquestador: Frailes, el bibliotecario.

🧠 El clúster opera con nombres locales: Cubagua, Nagasaki, Frailes, Palata, Pico-Pi y más.

ComponenteEspecificaciones / Rol
Gateway MGLTTARM M4 (200MHz) • Ubuntu 22.04 • 512MB DDR3L + eMMC 4GB
Cache Edge StoneeMMC 4GB (artefactos frecuentes)
Clasificador WhatsAppARM Cortex-A7 32-bit (doble núcleo) + TensorFlow Lite
Prometheus + Picos-PIMétricas hacia Cubagua y Trailer Nagasaki

🧪 Reporte técnico - Infraestructura distribuida (actualización automática)

Páginas

Entrada destacada

¡ 𝐍𝐎 𝐇𝐀𝐘 𝐋𝐔𝐙 𝐄𝐍 𝐄𝐋 𝐓Ú𝐍𝐄𝐋 !

60 día luego de la Crisis Hídrica de Cumaná: 0:07 Es que el problema de la crisis es tan profunda y tan grande que aquí debería haber una ...

Entradas populares

Visitas: