Top 10 mýtov vedcov o údajoch týkajúcich sa rolí v Indii



Tento článok o mýtoch o najlepších vedeckých pracovníkoch v odbore 10, ktorý objasní všetky vaše pochybnosti o úlohách vedeckého pracovníka v Indii, a objasní skutočnosť.

sa ukázal ako jedno z najpopulárnejších oblastí v poslednej dobe. Rastie úžasným tempom, rovnako ako dopyt po Data Scientists. Úloha dátového vedca je mimoriadne dynamická, nie sú pre nich dva dni rovnaké, a preto je tak jedinečná a vzrušujúca. Pretože je to nové pole, je v ňom vzrušenie aj zmätok. Poďme si teda objasniť tieto mýty Data Scientists v nasledujúcom poradí:

Kto je dátový vedec?

Aj keď existuje niekoľko definícií pojmu k dispozícii, v podstate sú to profesionáli, ktorí sa venujú umeniu Data Science. Vedci zaoberajúci sa údajmi prekonávajú zložité problémy s dátami vďaka svojej odbornosti vo vedeckých disciplínach. Je to pozícia špecialistov.





Data-Scientist-Myths

Špecializujú sa na rôzne typy zručností, ako sú reč, analytika textu (NLP), spracovanie obrazu a videa, medicína a simulácia materiálov, atď. Každá z týchto rolí špecialistov je veľmi obmedzená počtom, a preto je hodnota takéhoto špecialistu nesmierna. Čokoľvek, čo naberie na obrátkach, sa rýchlo stane tým, o čom hovorí každý. A čím viac ľudí o niečom hovorí, tým viac sa hromadí mylné predstavy a mýty. Poďme teda odhaliť niektoré mýty o Data Scientist.



apache spark v porovnaní s hadoop mapreduce

Mýty vedcov v oblasti dát vs. realita

  • Musíte byť Ph.D. Držiak

Ph.D. je nepochybne veľmi veľkým úspechom. Výskum vyžaduje veľa tvrdej práce a odhodlania. Je však potrebné stať sa dátovým vedcom? Závisí to od typu práce, pre ktorú chcete ísť.

Ak sa chystáte Úloha aplikovanej dátovej vedy ktorá je primárne založená na práci s existujúcimi algoritmami a porozumení ich fungovaniu. Väčšina ľudí patrí do tejto kategórie a väčšina otvorov a popisov pracovných pozícií, ktoré vidíte, je iba pre tieto roly. Pre túto rolu vy NEROBTE potrebovať doktorát stupňa.

Ale, ak chcete ísť do Výskumná rola , potom možno budeš potrebovať Ph.D. Stupňa. Ak je vašou vecou práca na algoritmoch alebo písanie článku, potom Ph.D. je cesta.



  • Data Scientist bude čoskoro nahradený AI

Ak si myslíte, že veľa vedcov v oblasti dát môže urobiť všetko, čo súvisí s Projekt AI / ML . Nie je to praktické riešenie, pretože ak sa zameriavate na akýkoľvek projekt umelej inteligencie, je s ním spojený celý rad pracovných miest. je veľmi zložité pole s mnohými rôznymi rolami, ako sú:

  • Štatistik
  • Expert na domény
  • Špecialista na internet vecí

Samotní dátoví vedci nemôžu vyriešiť všetko a nie je to možné ani pre AI. Takže, ak ste jedným z tých, ktorí sa toho boja, DONT. AI zatiaľ nie je schopná robiť také veci, potrebujete obrovské množstvo znalostí o rôznych doménach.

  • Viac údajov poskytuje vyššiu presnosť

Existuje veľmi veľká mylná predstava a jeden z mýtov veľkých Data Scientists, že „čím viac údajov máte, tým viac bude presnosť modelu“. Viac údajov neprekladá na vyššiu presnosť. Na druhej strane, malé, ale dobre udržiavané údaje môžu mať lepšiu kvalitu a presnosť. Najdôležitejšie je porozumieť údajom a ich použiteľnosť. Je to Kvalita na čom záleží najviac.

  • Hlboké učenie je určené len pre veľké organizácie

Jedným z najbežnejších mýtov je, že na vykonávanie úloh Deep Learning potrebujete značné množstvo hardvéru. To nie je celkom falošné, model hlbokého učenia bude vždy účinnejší, keď bude mať k dispozícii výkonné nastavenie hardvéru. Môžete ho však spustiť na lokálnom systéme alebo Google Colab (GPU + CPU). Naučenie modelu na vašom stroji môže trvať dlhšie, ako sa očakávalo.

  • Zber údajov je jednoduchý

Dáta sa generujú neuveriteľnou rýchlosťou okolo 2,5 Quintillion Bajtov za deň a zhromažďovanie správne údaje v správnom formáte je stále ťažká úloha. Musíte si postaviť a správne potrubie pre váš projekt. Existuje veľa zdrojov na získavanie údajov. Náklady a kvalita sú veľmi dôležité. Udržiavanie integrity údajov a potrubí je veľmi dôležitá súčasť, s ktorou by sa nemalo narábať.

  • Dátoví vedci pracujú iba s nástrojmi / Všetko je to o nástrojoch

Ľudia sa zvyčajne začnú učiť nástroj v domnení, že dostanú prácu v odbore Data Science. Naučiť sa nástroj je dôležité, aby pracoval ako vedecký pracovník v oblasti údajov, ale ako som už spomenul, ich úloha je omnoho rozmanitejšia. Vedci zaoberajúci sa údajmi by mali ísť nad rámec použitia nástroja na odvodenie riešení, musia si osvojiť základné zručnosti. Áno, zvládnutie nástroja vytvára nádej na ľahký vstup do Data Science, ale spoločnosti, ktoré si najímajú Data Scientists, nebudú namiesto toho brať do úvahy iba odborné znalosti o nástrojoch, hľadajú profesionála, ktorý získal kombináciu technických a obchodných zručností.

  • Musíte mať znalosti z oblasti kódovania / informatiky

Väčšina vedcov v oblasti údajov vie dobre programovať a môže mať skúsenosti s informatikou alebo matematikou alebo štatistikou. To neznamená, že ľudia z iných prostredí nemôžu byť dátovými vedcami. Je potrebné mať na pamäti jednu vec, že ​​títo ľudia z týchto prostredí majú výhodu, ale to je iba v počiatočných fázach. Musíte len naďalej venovať odhodlanie a tvrdú prácu a čoskoro to bude ľahké aj pre vás.

  • Súťaže v oblasti dátovej vedy a projekty v reálnom živote sú rovnaké

Tieto súťaže sú skvelý začiatok na dlhej ceste Data Science. Môžete pracovať s veľkými súbormi údajov a algoritmami. Všetko je v poriadku, ale považovať to za projekt a vložiť ho do životopisu je určite nie dobrý nápad pretože tieto súťaže nie sú nijako blízke skutočnému projektu. Nemôžete vyčistiť špinavé dáta ani ich budovať potrubia alebo skontrolujte časový limit. Dôležitá je iba presnosť modelu.

  • Všetko je o prediktívnom vytváraní modelov

Ľudia si zvyčajne myslia, že Data Scientists predpovedajú budúci výsledok. Prediktívne modelovanie je veľmi dôležitým aspektom dátovej vedy, ale samo o sebe vám nemôže pomôcť. V každom projekte sú viac krokov zapojený do celý cyklus počnúc zberom dát, hádkami, analýzou dát, školením algoritmu, zostavením modelu, testovaním modelu a nakoniec nasadením. Musíte poznať celok end-to-end proces . Pozrime sa na posledné mýty o Data Scientists.

  • AI sa bude naďalej vyvíjať, akonáhle bude postavená

java casting zdvojnásobiť na int

Je bežnou mylnou predstavou, že AI naďalej rastie, vyvíja sa a zovšeobecňuje sa sama. No, sci-fi filmy neustále vykresľujú to isté posolstvo. Teraz to vôbec nie je pravda, v skutočnosti sme pozadu. Najviac, čo môžeme urobiť, je trénovať modely, ktoré sa trénujú samy, ak im budú poskytnuté nové údaje. Nedokážu sa prispôsobiť zmenám v prostredí a novému typu údajov.

Takže. ak si myslíte, že jednodňové stroje budú robiť všetku prácu? No, musíte sa dostať z kina!

Dúfam, že všetky vaše mýty o dátových vedcoch sú už vymazané. Edureka tiež poskytuje a . Zahŕňa školenie v oblasti štatistík, Data Science, Python, Apache Spark & ​​Scala, Tensorflow a Tableau.

Máte na nás otázku? Uveďte to prosím v sekcii komentárov v článku „Mýty o Data Scientists“ a my sa vám ozveme.