Category archive: Big Data

Monta tu propio dashboard de Bitcoin con InfluxDB, Grafana y Python

Las bases de datos de series cronológicas (Time series Databases) pueden entenderse a grandes rasgos como motores de almacenamiento clave-valor donde la clave es un timestamp. Dicho de esta manera es fácil darse cuenta de los casos de uso principales para tecnologías como InfluxDB, Grafite y Prometheus, los cuales son bastante conocidos para datos como métricas de:

  • Uso de CPU
  • Consumo de Memoria
  • I/O de disco
  • Uso de red

Una de las herramientas más populares y mejor mantenidas del mercado es Grafana, que permite leer distintos Datasources para construir gráficas y dashboards muy interesantes.… Leer mas

ingestion_datos_Apache_nifi_Apache_Kafka

Ingestión de datos con Apache Nifi y Apache Kafka

Webinar organizado por KeepCoding que muestra en unos sencillos pasos la integración de ambos sistemas, que una vez puestos en marcha en Kafka, se pueden pasar a otros sistemas rápidamente.

Ingestión_de_datos_con_Apache_Nifi_y_Apache_Kafka

Usado en plataformas pioneras en tecnología

Nifi (NiagaraFiles) es un proyecto de software de Apache diseñado para automatizar el flujo de datos entre diferentes sistemas de software.… Leer mas

logo-apache-hadoop

Guía Tutorial: Cómo montar tu entorno Hadoop monocluster (1)

Un ejemplo de cómo jugar con nuestro entorno de Big Data es resolviendo algún problema cotidiano, que lo podríamos hacer de forma lazy.

Yo, por ejemplo, me encuentro que cada x tiempo tengo invitaciones en LinkedIn y, de vez en cuando, añado gente con algún criterio basado en mis intereses, así que un proyecto interesante sería encontrar una forma para que, cada día, las invitaciones nuevas se aceptaran si cumplen unos requisitos y que a cierta cantidad de gente se le enviara una invitación según unos parámetros.… Leer mas

tecnologias-conectadas-a-big-data-y-machine-learning

¿Qué se necesita para ser Científico de Datos?

Antes de explicar qué habilidades y requisitos necesita un científico de datos, debemos tomar una definición para saber exactamente qué es, qué hace y cómo alguien se convierte en este profesional del Big Data y Machine Learning.

Una explicación podría ser la que nos ofrece Josh Wills, Director de Ingeniería de Datos en Slack: «Data Scientist (n): Persona mejor en estadística que cualquier desarrollador y mejor en programación que cualquier estadístico».… Leer mas