BIG DATA
El big data hace referencia a la acumulación
masiva de datos.
El big data viene a ser la tendencia en el avance de
la tecnología que ha abierto las puertas hacia un nuevo enfoque de
entendimiento y toma de decisiones, la cual es utilizada para describir enormes
cantidades de datos. Aplica para toda aquella información que no puede ser
procesada o analizada utilizando procesos o herramientas tradicionales.
Todos estamos creando y almacenando información
constantemente y cada vez más en cantidades, por lo que todo esos datos se van
acumulando en diversas industrias… todas aquellas actividades que la mayoría de
nosotros realizamos varias veces al día con nuestros telefonos moviles, estamos
hablando de que se generan alrededor de 2.5 quintillones de bytes diariamente
en el mundo.
Datos masivos es un término que hace referencia a una
cantidad de datos tal que supera la capacidad del software habitual para ser
capturados, gestionados y procesados en un tiempo razonable.
Hay muchas herramientas para tratar con Big Data. Nombres
como Hadoop, NoSQL, Cassandra, Business Intelligence, Machine Learning, MapReduce…
son sólo algunos de los más conocidos. Ellos tratan con algunos de los tres
tipos de Big Data.
-
Datos estructurados: Datos que tienen
bien definidos su longitud y su formato, como las fechas, los números o las
cadenas de caracteres. Se almacenan en tablas.
-
Datos no estructurados : Datos en el
formato tal y como fueron recolectados, carecen de un formato específico. No se
pueden almacenar dentro de una tabla ya que no se puede desgranar su
información a tipos básicos de datos.
-
Datos semiestructurados: Datos que no se
limitan a campos determinados, pero que contiene marcadores para separar los
diferentes elementos. Es una información poco regular como para ser gestionada
de una forma estándar. Estos datos poseen sus propios metadatos
semiestructurados que describen los objetos y las relaciones entre ellos, y
pueden acabar siendo aceptados por convención.
No hay comentarios:
Publicar un comentario