What’s in a name?

Know the differences between a Big Data Specialist, a Data Scientist, and a Data Analyst

La quantité de données augmente de façon exponentielle. Pensez par exemple aux données que Google, Facebook et LinkedIn conservent à propos de leurs membres. Le secteur de l’assurance planche lui aussi sur l’optimisation des données de ses clients afin de proposer un service à la clientèle mieux intégré.

Know the basics!

Big data concerne d’énormes quantités de données qui ne peuvent plus être traitées efficacement à l’aide d’applications traditionnelles. Les entreprises dont le fonctionnement repose sur les données sont quotidiennement inondées d’une masse énorme de données, informations variées qui arrivent rapidement. Leur analyse peut déboucher sur des décisions stratégiques et générer d’autres formes d’automatisation.
Les banques et les assurances ont recours au Big data pour optimiser leurs services financiers. La masse de données qui se trouvent à l’heure actuelle encore dans des bases de données séparées sont regroupées par le Big data en fonction de l’analyse des éléments suivants :
• Customers
• Compliance
• Fraude
• Gestion opérationnelle

Le Data Science (Science des données) examine aussi bien des données structurées que des données non structurées à l’aide d’un éventail de techniques (statistique, mathématiques, programmation, résolution de problèmes, combinaison ingénieuse de données, etc.) afin de nettoyer les données et de les préparer à leur traitement ultérieur.
Le Data Science est utilisé pour la mise au point des recherches sur Internet (par exemple : Google) ; la publicité et les recommandations numériques (par exemple : si vous recherchez et achetez un produit en ligne, vous recevez des publicités pour des produits apparentés).

Data Analytics est la science qui analyse les données entrantes brutes en fonction de directives déterminées (algorithmes) pour tirer des conclusions des données. L’accent est mis sur les corrélations entre données : les divers types de données sont comparés afin de déterminer ce qui les relie.
L’analyse de données est utilisé pour la mise au point des recherches sur Internet (par exemple : Google) ; la publicité et les recommandations numériques (par exemple : si vous recherchez et achetez un produit en ligne, vous recevez des publicités pour des produits apparentés). L’analyse de données est utilisée pour rendre les services à la clientèle plus efficace (et rentable) et pour optimiser l’expérience du client. Un produit adéquat peut ainsi être proposé grâce à l’analyse des médias sociaux du client, par exemple une assurance voyage en plus de conseils voyage personnalisés.

Know the required competences (anno 2016 – US)

Big Data Scientist
• Masters (88 %) & Doctorands (46%) en mathématiques, statistique
• Expert en SAS
• Python, ainsi que Java, Perl, C/C++
• Plate-forme Hadoop, ainsi que Hive et Pig
• Bases de données/codage SQL
• Les données non structurées sur les médias sociaux, les feeds vidéo, audio, etc. peuvent être maîtrisées
• Programmation d’algorithmes (directives) pour rationaliser les données et les rendre compréhensibles

Data Analist
• Compétences analytiques pour sélectionner des données pertinentes dans la masse
• Créativité dans la recherche de nouvelles méthodes de recherche et d’analy
• Programmation sous Python et R
• Mathématiques et statistique
• Automatisation de processus – compétences de machine learning
• Formatage de données brutes dans les systèmes de gestion
• Communication et visualisation des données et compétences de présentation
• Sens inné des données
• Business awareness

Source : SimpliLearn