Big Data désigne un nombre tellement important de collections d’enregistrements que des systèmes traditionnels de bases de données ou autres outils semblables ont du mal à traiter dans un délai fongible. Les défis en résultant sont dans ce cas l’importation, la conservation, la sauvegarde, la recherche, la publication, le transfert, l’analyse et la visualisation d’enregistrements. Au lieu des systèmes de traitement traditionnels, une parallélisation élevée de groupements d’ordinateurs – variant entre des douzaines et des milliers d’ordinateurs – est nécessaire pour Big Data ainsi que des outils correspondants pour la compensation de la performance.
La taille et la désignation de Big Data varient chaque année. En 2012 il est question d’un domaine commençant avec quelques téraoctets et allant jusqu’à plusieurs douzaines de pétaoctets. L’objectif et le défi de Big Data consistent dans le perfectionnement permanent de systèmes traditionnels de bases de données ainsi que dans la création de nouvelles technologies, comme par ex. /bigdata-db/, /bigdata-hd/ ou NoSQL /nosql/.
Exemples d’application
Il convient d’évoquer Big Science /bigs1/, /bigs2/, RDIF /rfid/, les réseaux de capteurs, les réseaux sociaux, “Big social data analysis” /bsda/, les documents Internet, l’indexation de contenus Internet pour effectuer des recherches dans les secteurs de l’astronomie, météorologie, génomique, biogéochimie, biologie et d’autres recherches scientifiques fortement multidisciplinaires telles Intelligence militaire, enregistrements médicaux et autres disciplines.
Big Data et Web sémantique
Les technologies Big Data permettent une performance plus élevée pour le déroulement de transactions habituelles de données – elles s’approprient notamment comme substrat pour l’exécution d’actions Web sémantique (LOD-ification, réalisation de liens logiques, exportation, importation, compensation). La sélection du substrat technologique Big Data peut assurer le succès pour les prochaines 5 à 10 années. Un plus grand nombre de données (dans la plage gigaoctets/téraoctets) garantit en règle générale une plus vaste base pour des algorithmes et des heuristiques ; l’utilisation d’un substrat étroit échelonnable permet alors d’augmenter leur précision et signifiance en comparaison à des solutions traditionnelles /bdsw/.
Big Data et Web sémantique
Dans le monde informatique, les systèmes “Legacy” – également appelés “Anciens systèmes” sont synonymes d’applications d’entreprises établies, ayant grandi dans l’histoire, lesquelles applications sont en partie prises en charges par de grandes calculatrices ou peuvent être exploités sur des systèmes d’exploitation un peu plus vieux. Un système Legacy est souvent le cœur opérateur d’une entreprise, lequel peut uniquement être remplacé après de minutieuses valorisations – ou bien obligatoirement après la suppression de l’assistance de la part d’un prestataire.
Avec la mise à disposition et la libération de quantités de données toujours plus importantes, un système Legacy peut venir à bout de ses limites de complexité, être inadéquat pour l’édition et finalement représenter un étranglement pour l’entreprise. L’entreprise retrouve sa stabilité dans le traitement des données d’entreprise en évaluant minutieusement le système de remplacement prenant la succession et en planifiant la migration des données et la succession du système.