Quelle est la différence entre travailler en analytique et en science des données?


Réponse 1:

L'analyse de données est quelque part facile par rapport à la science des données.

Voyons les différences entre eux et les rôles et compétences des deux afin que vous puissiez avoir une idée claire du rôle de travail de Data scientist et analyst.

Data Scientist vs Data Analyst selon la définition

  • Un rôle de Data Scientist est de prédire l'avenir en fonction des modèles passés. Alors que l'analyste de données trouve des informations significatives à partir des données, le rôle du Data scientist est de générer sa propre question. Mais l'analyste de données trouve les réponses à d'autres séries de questions. Mais les analystes de données sont ceux qui effectuent l'analyse au jour le jour. Il donne également une prédiction précise de la valeur des affaires une fois résolues. Alors que Data Analyst ne traite que les problèmes métier, Data Scientist utilise l'apprentissage automatique pour extraire des informations. Mais Data Analyst utilise un outil R / SAS pour extraire des informations. Le rôle du Data scientist est d'explorer et d'examiner les informations. Il explore des informations provenant de nombreuses sources déconnectées. Mais Data Analyst explore et examine les données à partir d'une seule source. La prédiction de Data Scientist est très élevée. Il peut être précis jusqu'à 90%. Mais, les analystes de données ne prédisent pas. Ils ne résolvent que la question posée par l'entreprise. Un Data scientist formulera des questions. Ils formulent les questions dont les solutions sont susceptibles de bénéficier à l'entreprise. Mais Data Analyst ne résout que les questions posées par les entreprises. Un Data Scientist doit avoir une bonne connaissance des modèles statistiques et du machine learning. Data Analyst a besoin de solides connaissances en SAS / R

Data Analyst vs Data Scientist selon les responsabilités

a) Responsabilités d'un scientifique des données

  • Nettoyage et traitement des données. Prévision du problème commercial. Ses rôles consistent à donner les résultats futurs de cette entreprise. Développer des modèles d'apprentissage automatique et des méthodes analytiques. Trouver de nouvelles questions commerciales qui peuvent ensuite ajouter de la valeur à l'entreprise. et faire l'analyse ad hoc.

b) Responsabilités de l'analyste des données

  • Identifiez tous les problèmes de qualité des données lors de l'acquisition de données. En mappant puis en traçant les données.Un analyste de données doit se coordonner avec les ingénieurs pour recueillir de nouvelles données.Effectuer une analyse statistique des données commerciales.Documenter les types et la structure des données commerciales.

4.3. Rôles Data Analyst vs Data Scientist basés sur des ensembles de compétences

a) Rôles de Data Scientist en fonction de leurs compétences

  • Les créateurs de données Développeurs de données Chercheurs de données

b) Rôles d'analyste de données en fonction de leurs compétences

  • Administrateurs de bases de donnéesOpérationsArchitectes de donnéesA Analystes de données

4.4. Data Scientist vs Data Analyst - Salaire

Les statistiques ci-dessous montrent le salaire de Data Scientist vs Data Analyst-

Pour en savoir plus, reportez-vous au lien ci-dessous:

Science des données vs analyse des données


Réponse 2:

Merci pour l'A2A.

Je ne suis pas d'accord pour dire que l'analyse et la science des données sont les mêmes. Sur la base des demandes de notre équipe de science des données, je rejette malheureusement de nombreux candidats travaillant en «analytics» qui postulent.

Il y a beaucoup de bruit dans l'espace et aucune définition largement acceptée, donc j'éviterai de me lancer dans des «débats sur la définition».

Mais au niveau pratique, l'équipe de science des données est responsable du développement et de la mise en œuvre du modèle. Qu'il s'agisse de modèles de simulation, de modèles d'apprentissage automatique, de modèles de prévision de séries chronologiques ou de modèles d'inférence statistique, la responsabilité incombe à la science des données de:

  • Effectuez la traduction des problèmes et choisissez la ou les bonnes approches de modélisation Construisez et / ou gérez les fonctionnalités du pipeline de données d'une manière adaptée à la modélisation, la sortie de nos projets fournissant souvent des exigences à d'autres équipes de données Choisissez, optimisez et évaluez le (s) modèle (s) de manière itérative Soutenir les activités de mise à l'échelle des modèles en production Recommandations de décision de cadre d'une manière cohérente avec les résultats du modèle

Tout le reste n'est pas unique et peut être effectué par des professionnels de l'analyse de données ou d'autres équipes.

Cela comprend les outils open source, la programmation, le travail avec les `` mégadonnées '', la narration, la connaissance du domaine, le traitement des données, la création de visualisations, la fourniture d'informations, la curiosité, la possession de doctorats, le traitement des données non structurées.

Mais lorsque vous avez un professionnel de l'analyse et un data scientist, et que vous devez vous concentrer sur un modèle, cela devrait appartenir à la science des données.

De nombreux lecteurs comprendraient également très clairement l'implication de ceci:

  • Pour réussir, nous avons besoin de beaucoup de professionnels de l'analyse, de professionnels des données (et de beaucoup d'autres) ainsi que de scientifiques des données.

Cette réponse n'est pas exhaustive, mais elle explique en grande partie le bruit, les attentes mal alignées, les chiffres de demande inexacts et les lacunes dans l'exécution.


Réponse 3:

La réponse courte est qu'il n'y a pas de différence et qu'une organisation compétente aura un certain équilibre des deux. Ce sont deux applications de l'interprétation humaine des données informatiques. La différence essentielle est que «l'analyse de données» est tout ce que votre comptable moyen reconnaîtra dans une feuille de calcul, dans le contexte de ce qui est présenté dans une feuille de calcul. C'est-à-dire les nombres, les pourcentages, les tendances. Alors que la science des données fait un pas de plus vers des mesures plus sophistiquées telles que les corrélations, les intervalles de confiance, les moments. Toujours avec la science des données, il est plus probable que l'on soit impliqué dans la prévision et la conception de sous-ensembles représentatifs significatifs des données complètes.

Prenons donc un exemple de burger. Une chaîne de restauration rapide en Californie a engagé mon ancien employeur pour mettre une application analytique sur ses données POS. Personne avant ce moment n'avait une compréhension très large de combien d'argent était fait quotidiennement par ses 400 magasins impairs. Les nouvelles données de point de vente utilisaient des codes de produit, et maintenant nous savions jusqu'à chaque reçu, combien d'argent chaque client dépensait pour chaque produit dans le menu. Compte simple par le temps. Cela a indiqué à la chaîne à quelles périodes de la journée ils ont vendu quels aliments et combien. Ensuite, ils ont fait quelques calculs simples pour comprendre l'efficacité de leurs cuisiniers et caissiers et ont découvert qu'ils faisaient des pauses et des quarts de travail au mauvais moment. Donc, juste en comptant, ils ont compris qu'ils devraient exécuter un quart de quatre heures de 10 h à 14 h au lieu d'un de 8 h à midi, car interrompre le quart de travail au début de «l'heure du déjeuner» était une erreur. Il n'y avait pas d'heure de déjeuner, il y avait un déjeuner de quatre heures avec un pic vers 12h20.

Ils ont changé leurs schémas de dotation, remonté le moral des employés et la satisfaction des clients simplement en suivant ce que les * données * disaient sur les heures d'achat des clients, plutôt que des idées standard sur ce qu'est l'heure du déjeuner. Même avec le petit déjeuner, même avec le dîner, même avec tard le soir. Voilà l'analyse.

Maintenant, prenez ce même ensemble de données et exécutez des corrélations sur les côtés vendus avec quels hamburgers. (Ils ne l'ont pas fait). Et vous constaterez que, par exemple, les gens qui ont commandé des tacos n'ont presque jamais commandé de frites avec eux. Cela réorganiserait donc ce qu'ils vendent comme un «combo de repas». Ensuite, lorsque quelqu'un commande un taco au volant, une invite en temps réel pourrait dire au caissier de suggérer un côté de taquitos ou de sauce supplémentaire.

Mon expérience me dit que la majeure partie de la valeur à extraire des données est opérationnelle. C'est-à-dire que le décompte par le temps est très précieux, tout comme l'ajout de dimensions et d'attributs à des données simples. Mais lorsque vous souhaitez démarrer la prédiction, vous avez besoin d'outils plus sophistiqués qu'une simple agrégation. Le gain est dans l'analyse, affinant que le gain est dans la modélisation prédictive. Mais oui, vous avez toujours besoin de l'intuition des gestionnaires qui exploitent l'entreprise pour vous engager (ou non) dans vos projections informatiques. C'est là que réside l'art de l'intelligence économique qui consiste à trouver le bon équilibre entre les données informatiques et les connaissances humaines à appliquer à un problème commercial. [1]

La partie la plus importante du travail d'un scientifique des données, à mon avis, est de comprendre les contraintes mathématiques sur les données pour déterminer dans quelle mesure elles peuvent être fiables, et quelle est la bonne taille d'échantillon à considérer étant donné les possibilités de suivre sa sortie. En d'autres termes, il s'agit d'une sorte d'inférence spécialisée. Maintenant que la technologie et la méthodologie ont rendu moins coûteuse l'agrégation de quantités massives de données, les statisticiens, les scientifiques des données doivent nous dire combien nous risquons en fonction de ces données, ou si nous n'avons pas assez pour prendre les bonnes décisions. [2]

Notes de bas de page

[1] Les quatre piliers de la Business Intelligence

[2] Obstacles à la valeur ajoutée dans l'analyse des données