Si alguna vez pensó en la cantidad de datos masivos que generan y almacenan servicios en línea como Facebook y Google en forma diaria, debe saber que es difícil de resolver.
Todo lo que necesita hacer es mirar en su propio feed de Facebook para ver la enorme cantidad de datos agregados constantemente todos los días. Eso incluye cosas como actualizaciones de estado con un simple texto a vídeos y grandes archivos de fotos.
Facebook recientemente dio a conocer algunas estadísticas sobre la cantidad de datos procesados por su sistema y tiendas.
Según la red social, su sistema de datos procesa 2,5 millones de piezas de contenido cada día por valor de 500+ terabytes de datos diarios. Facebook genera 2700 millones de “Me gusta” por día y 300 millones de nuevas fotos se suben a diario.
Además, la compañía dice que examina aproximadamente 105 TB de datos cada media hora. Mientras que 500 TB es una gran cantidad de datos, eso es sólo una gota en el océano comparado con la cantidad de datos almacenados en un solo disco de clúster Hadoop.
Según el vicepresidente de ingeniería de Facebook, Jay Parikh, un disco clúster Hadoop tiene 100 petabytes de datos. Un petabyte es solo 1.048.576 gigabytes. Parikh cree que Facebook que opera el principal grupo de Hadoop en el mundo.
Más detalles en: Slashgear