Zručnosti vedcov v oblasti základných údajov



Tento blog popisuje základné zručnosti Data Scientist Skills spolu s kontrolným zoznamom zručností potrebných na to, aby sa z vás stal úžasný a efektívny Data Scientist. Čítajte ďalej >>>

Dvaja analytici z LinkedIn zaviedli v roku 2008 výraz „data scientist“. Snažili sa iba opísať, čo robia, t. J. Odvodiť obchodnú hodnotu z masívnych údajov generovaných ich webovými stránkami. V tomto procese nakoniec pomenovali názov pracovnej pozície, ktorá by v nadchádzajúcich rokoch zaznamenala neuveriteľný dopyt a bola dokonca označovaná ako „Najsexi práca z 21 rokovsvstoročia. “

Organizácie, ktoré považujú dáta za hodnotné aktívum, teraz hľadajú týchto expertov alebo vedcov, ktorí by ich viedli do budúcnosti.





Čo teda znamená byť vynikajúcim vedcom v oblasti dát? ……… Rôzne sady zručností!

Stručný pohľad na základné zručnosti dátového vedca.



Proces dátovej vedy zahŕňa 3 etapy.

  • Zachytávanie údajov
  • Analýza dát
  • Prezentácia

Pozrime sa podrobnejšie na úlohu dátového vedca v každej z týchto etáp.

Zachytávanie údajov



  • Programovacie a databázové zručnosti

Prvým krokom dolovania údajov je zachytenie správnych údajov. Aby ste boli vedeckými pracovníkmi v oblasti údajov, je veľmi dôležité poznať nástroje a technológie, najmä tie, ktoré sú otvorené ako Hadoop, Java, Python, C ++, a databázové technológie ako SQL, NoSQL, HBase atď.

  • Obchodná doména a odborné znalosti

Údaje sa líšia v závislosti od podnikania. Preto pochopenie obchodných údajov vyžaduje odbornosť, ktorá prichádza iba pri práci v konkrétnej doméne údajov.

Napríklad: Údaje zhromaždené z oblasti medicíny sa budú úplne líšiť od údajov maloobchodu s odevmi.

  • Dátové modelovanie, sklad a zručnosti v oblasti neštruktúrovaných údajov

Organizácie zhromažďujú obrovské množstvo údajov prostredníctvom rôznych zdrojov. Údaje zachytené týmto spôsobom sú neštruktúrované a pred analýzou je potrebné ich usporiadať. Preto musí byť dátový vedec zdatný v modelovaní neštruktúrovaných údajov.

Analýza dát

  • Zručnosti v oblasti štatistických nástrojov

Základnou zručnosťou dátového vedca je vedieť, ako používať štatistické nástroje ako R, Excel, SAS a tak ďalej. Tieto nástroje sú potrebné na rozomletie zachytených údajov a ich analýzu.

  • Matematické zručnosti

Samotné znalosti informatiky nestačia na to, aby ste boli vedeckým pracovníkom v oblasti údajov. Profil dátového vedca vyžaduje niekoho, kto dokáže porozumieť rozsiahlym algoritmom strojového učenia a programovaniu, pričom je schopný štatistik. To si vyžaduje znalosti v iných vedeckých a matematických disciplínach okrem počítačových jazykov.

Prezentácia

  • Zručnosti vizualizačného nástroja

Zhromaždené údaje možno budete môcť ťažiť a modelovať, ale viete si ich vizualizovať?

Ak chcete byť úspešným vedcom v oblasti dát, mali by ste byť schopní pracovať s niektorými nástrojmi na vizualizáciu údajov tak, aby ste vizuálne predstavovali analýzy údajov. Niektoré z nich zahŕňajú R, Flare, HighCharts, AmCharts, D3.js, Processing a Google Visualization API atď.

Ale to nie je koniec! Ak sa skutočne chcete stať vedcom v oblasti údajov, mali by ste tiež mať tieto schopnosti:

  • Komunikačné schopnosti: Štatistiky a Excel sú zložité riešenia. Vedci v oblasti údajov by mali byť schopní prezentovať údaje spôsobom, ktorý komunikuje s výsledkami podnikovým používateľom.
  • Obchodné zručnosti : Vedci zaoberajúci sa údajmi budú musieť hrať viac rolí. Potrebovali by komunikovať s rôznymi ľuďmi v organizácii. Preto bude veľmi užitočné mať silné obchodné zručnosti, ktoré zahŕňajú komunikáciu, plánovanie, organizovanie a riadenie. To zahŕňa pochopenie obchodných a aplikačných požiadaviek a zodpovedajúcu interpretáciu informácií. Mal by tiež celkovo rozumieť kľúčovým výzvam v priemysle a mal by si byť vedomý finančných pomerov pre lepšie rozhodovanie. Zrátané a podčiarknuté, vedec zaoberajúci sa údajmi, ktorý si myslí tiež „biznis“.
  • Schopnosti riešenia problémov: Zdá sa to zrejmé, pretože dátová veda je predovšetkým o riešení problémov. Efektívny vedec v oblasti údajov musí venovať čas a hlboko sa problému venovať a prísť s uskutočniteľným riešením, ktoré bude vyhovovať používateľovi.
  • Predikčné schopnosti: Vedec v oblasti údajov by mal byť tiež efektívnym prediktorom. Mal by mať rozsiahle znalosti o algoritmoch, aby vybral ten správny, aby správne zapadol do dátového modelu. Vyžaduje to určitú mieru kreativity, ktorá sa dá využiť a údaje prezentovať s rozumom.
  • Hackovanie: Viem, že to znie strašidelne, ale rôzne hackerské schopnosti, ako je manipulácia s textovými súbormi na príkazovom riadku, pochopenie vektorizovaných operácií a algoritmické myslenie, z vás urobia lepšieho vedca v oblasti údajov.

Pri pohľade na vyššie uvedené súbory zručností je zrejmé, že byť vedeckým pracovníkom v oblasti údajov nie je len vedieť všetko o dátach. Je to pracovný profil so zlúčením dátových, matematických, obchodných a komunikačných schopností. Vďaka všetkým týmto zručnostiam možno dátového vedca právom označiť za rockovú hviezdu v oblasti IT.

Kontrolný zoznam a staňte sa úžasným a efektívnym vedcom v oblasti údajov:

ako používať parametre v tablo

Poskytli sme vedomosti, ktoré sú potrebné na to, aby sme sa stali dátovým vedcom. Je obrovský rozdiel stať sa vedeckým pracovníkom v oblasti údajov a stať sa úžasným a efektívnym vedeckým pracovníkom v oblasti údajov. Nasledujúce schopnosti spolu s vyššie uvedenými zručnosťami vás odlišujú od toho, že ste normálnym alebo dokonca priemerným dátovým vedcom.

  • Matematické schopnosti - Výpočty, operácie s maticami, numerická optimalizácia, stochastické metódy atď.
  • Štatistické zručnosti - Regresné modely, stromy, klasifikácie, diagnostika, použitá štatistika atď.
  • Komunikácia - Vizualizácia, prezentácia a písanie.
  • Databáza - Okrem CouchDB aj znalosti v netradičných databázach, ako sú MongoDB a Vertica.
  • Programovacie jazyky - Prasa, Úľ, Java, Python atď.
  • Spracovanie prirodzeného jazyka a Ťažba dát.

Edureka má špeciálne upravené ktorá vám pomôže získať odborné znalosti v oblasti algoritmov strojového učenia, ako sú zhluky K-Means, rozhodovacie stromy, náhodný les, naivné zálivy. Naučíte sa tiež pojmy štatistika, časové rady, ťažba textu a úvod do hlbokého učenia. Nové dávky pre tento kurz čoskoro začnú !!