Теория Vol 10: Las fuentes y big data

Ben O'Brien's drawing
El verdadero peligro no es que las computadoras
comiencen a pensar como los hombres,
sino que los hombres comenzarán a pensar cómo las computadoras.
Sydney Harris

A partir de los años 50 del siglo XX una importancia ganó los recursos de la información masiva, y no importa si se trata de las variantes de los discursos de la misma persona o los fragmentos de la información recibidos por diferentes canales. Se trata de un conjunto de datos, en muchos casos semi ordenados o sin orden. Esa “colina” de la información a veces denomina como masivo de datos (mass data) para subrayar que son datos “crudos” sin procesar. Hablando de los aspectos informáticos, la mayoría de los estudios de big data y su análisis se enfoca en el análisis semántico, sin dedicar mucha atención a la estructura del contexto. Eso naturalmente lleva a la necesidad de separar los términos fuente de la información y datos. 
  1. La fuente es un sistema del nivel más alto, mientras que los datos son subsistemas creadas o detectadas por el medio de las actividades investigativas.
  2. Otro punto de vista a las fuentes masivas es la distinción entre lo único y masivo, donde los primeros reflejan lo principal, lo más importante y especifico; los segundos están ilustrando las leyes (rinden ejemplos y facilitan la explicación).
  3. El tercero punto de vista declara como las fuentes masivas los documentos del carácter muy específico y preciso, por ejemplo – un formulario. Cada uno de ellos no genera mucho interés, pero el conjunto de ellos permite descubrir alguna ley o relación. Entonces tercera opción habla de un conjunto de factos o fatos elementales, refiriendo la palabra masivo a la gran cantidad de los documentos estándares.
  4. El cuarto punto de vista asocia la fuente masiva con los sistemas complejos y su respectiva estructura. Las fuentes masivas representan y reflejan los hechos y las interacciones de esos sistemas del carácter masivo, dando la información sobre su estructura, funcionamiento y estado actual. Como una de las consecuencias de la cuarta definición es la aceptación de las fuentes que ofrecen la información generalizada, por ejemplo — procesada estadísticamente.
Las diferencias en la definición de las fuentes masivas no permiten elaborar una clasificación general, por eso recomendamos la vía neutra — tratarlos como un conjunto grande de datos significativos, por un lado; y por el otro — asume que el analista de big data debe tener los conocimientos que van mucho más allá de las tecnologías informáticas, que permiten extraer y agrupar los datos según los criterios implícitos por lo menos.
Coggle - Big Data

Комментарии