Otázky týkajúce sa rozhovoru s Google Data Science: Všetko, čo potrebujete vedieť, aby ste to dokázali rozlúsknuť



Tento článok obsahuje základné informácie o dotazovacom dotazníku Google Data Science Interview Questiosn, postupe pohovoru a predpokladoch uchádzať sa o prácu v spoločnosti Google.

Najať sa v globálne uznávanej spoločnosti, ako je Google, je práca snov pre mnoho ľudí. Majú jedných z najtalentovanejších vedeckých pracovníkov v oblasti výskumu AI, a vo svete. Nie je veľa zdrojov pre Google Dotazujte sa na rozhovor online a nie je ľahké sa tam zamestnať. V tomto článku sa teda budem venovať nasledujúcim témam:

Popis práce a požiadavky

S priemerným platom vo výške 169 067 dolárov , vrátane bonusu. Rozsah platov vedeckého pracovníka spoločnosti Google sa pohybuje od 120 000 - 280 000 dolárov . S týmto vysokým platom musíte poznať správne požiadavky na prácu, ktorú uchádzate. Aj keď sa požiadavky líšia od polohy k polohe, nižšie uvádzame niektoré z bežných:

Minimálna požiadavka:





ako nastaviť cestu k triede v systéme Windows 10

google

  • Magisterský titul v odbore kvantitatívna disciplína (štatistika, operačný výskum, informatika)
  • 2 roky pracovných skúseností v oblasti analýzy údajov
  • Skúsenosti so štatistickým softvérom (napr. R , , MATLAB, Pandy) a
  • Skúsenosti s jazykmi databázy (napr. SQL )

Zodpovednosti:



  • Pracujte s veľkými a zložitými súbormi údajov. Vyriešte zložité problémy s nerutinnou analýzou podľa potreby pomocou pokročilých analytických metód
  • Vykonajte analýzu, ktorá zahŕňa zhromažďovanie údajov a špecifikáciu požiadaviek, spracovanie, analýzu, priebežné výsledky a prezentácie
  • Budujte a prototypujte kanály analýzy iteratívne, aby ste poskytli prehľady v mierke
  • Rozvíjajte komplexné vedomosti o dátových štruktúrach a metrikách spoločnosti Google a zasadzujte sa za zmeny, kde je to potrebné pre vývoj produktu
  • Interakcia medzi funkciami, tvorba obchodných odporúčaní (napr. Pomer nákladov a výnosov, prognózy, analýza experimentov)
  • Výskum a vývoj metód analýzy, predpovedania a optimalizácie na zlepšenie kvality produktov spoločnosti Google zameraných na používateľov

Proces rozhovoru so spoločnosťou Google Data Science

Samotné vyčistenie užšieho výberu je ťažká úloha, ktorá úplne závisí od vašej úlohy Životopis, sprievodný list a Skúsenosti . Google Data Science Interview Questions are a combination of Brain teasers and Technical Queries. Prvý proces je zvyčajne telefonický rozhovor.

Telefonický rozhovor:

Skladá sa z otázok väčšinou založených na (konkrétne a teoretické) a vo veľkej miere založený na . Otázky sa tiež líšia podľa projektov, na ktorých ste pracovali.
  • Prípad 1: Rozhovory sa pýtali na techniky extrakcie prvkov, PCA (používané v projektoch), korelačnú analýzu, niektoré klasifikačné techniky, ktoré boli použité (SVM, GBM, neurónová sieť). Prečo nie logistická regresia, prečo GBM? - V podstate otázky týkajúce sa oddeliteľnosti tried.
  • Prípad 2: Prečo používať výber funkcií? Ak sú dva prediktory vysoko korelované, aký je vplyv na koeficienty v logistickej regresii? Aké sú intervaly spoľahlivosti koeficientov?
  • Prípad 3: Disk sa točí na vretene a vy neviete, akým smerom sa disk točí. Je vám poskytnutá sada špendlíkov. Ako pomocou pinov opíšete, akým spôsobom sa disk otáča?
Po telefonických rozhovoroch sú to stretnutia tvárou v tvár a kódovanie. Poďme sa preto diskutovať o najbežnejších otázkach týkajúcich sa rozhovorov s dátovými vedami Google. Aj keď tieto otázky nemusia byť kladené presne, ako je uvedené nižšie, pokúsil som sa ich pokryť veľa.

Dotazy na rozhovor s Google Data Science

Tieto otázky nie sú lákavkami, pretože Google ich radšej prestal klásť, majú podobné otázky, ktoré nazývajú Otázky na riešenie problémov . Je kladených veľa otázok týkajúcich sa strojového učenia, od všeobecných po praktické. Google v zásade pokrýva skôr šírku tém ako hĺbku. Q1. Ste v kasíne a máte dve kocky na hranie. Vyhráte 10 dolárov zakaždým, keď hodíte 5. Ak hráte, kým nevyhráte a potom neprestanete, aká je očakávaná výplata? Q2. Chystáte sa nasadnúť do lietadla do Londýna, chcete vedieť, či si musíte priniesť dáždnik alebo nie. Zavoláte trom svojim náhodným priateľom a každému z nich, ak prší. Pravdepodobnosť, že váš priateľ hovorí pravdu, je 2/3 a pravdepodobnosť, že na vás hrajú žartík klamaním, je 1/3. Ak všetci 3 z nich povedia, že prší, tak aká je pravdepodobnosť, že v Londýne skutočne prší. Q3. Ako by sa pridali nové Facebook členov do databázy členov a kódovať ich vzťahy k ostatným v databáze? Q4. Ako otestujete, že existuje vyššia pravdepodobnosť, že používateľ zostane aktívny po 6 mesiacoch, pretože má teraz viac priateľov? Q5. Dostanete 40 kariet so štyrmi rôznymi farbami - 10 zelených kariet, 10 červených kariet, 10 modrých kariet a 10 žltých kariet. Karty každej farby sú očíslované od jednej do desať. Náhodne sa vyberú dve karty. Zistite pravdepodobnosť, že vybrané karty nie sú rovnakého počtu a rovnakej farby. Q6. Vytvorte program v jazyku podľa vášho výberu na čítanie textových súborov s rôznymi tweetmi. Výstupom by mali byť 2 textové súbory - jeden, ktorý obsahuje zoznam všetkých jedinečných slov medzi všetkými tweetmi spolu s počtom opakovaných slov a druhý súbor by mal obsahovať stredný počet jedinečných slov pre všetky tweety. Q7. Čo urobíte, ak odstránenie chýbajúcich hodnôt z množiny údajov spôsobí zaujatosť? Q8. Disk sa točí na vretene a vy neviete, akým smerom sa disk točí. Je vám poskytnutá sada špendlíkov. Ako pomocou pinov opíšete, akým spôsobom sa disk otáča? Q9. Ako navrhnete mechanizmus odporúčaní pre pracovné miesta? Q10. Aký produkt chcete vytvoriť v spoločnosti Google? Q11. Autám je implantovaný sledovač rýchlosti, aby poisťovacie spoločnosti mohli sledovať stav nášho riadenia. Na základe tejto novej schémy, na aký druh obchodných otázok je možné odpovedať? Q12. Ako sa môžete rozhodnúť, či je jeden algoritmus lepší ako druhý? Q13. Krabica má 12 červených a 12 čiernych kariet. Ďalšia škatuľa má 24 červených a 24 čiernych kariet. Chcete náhodne vytiahnuť dve karty z jedného z dvoch políčok, ktoré políčko má vyššiu pravdepodobnosť získania kariet rovnakej farby a prečo? Q14. Aký je rozdiel medzi vrecovaným modelom a posilneným modelom? Q15. Vytvárate prehľad o nahrávaní obsahu používateľa každý mesiac a sledujete náhly nárast počtu nahrávaní za mesiac január. Nárast počtu nahrávaní je, najmä pri nahrávaní obrázkov. Čo si myslíte, že to bude príčinou a ako otestujete tento náhly výkyv? Q16. Vlastníte odevný podnik a chcete si vylepšiť svoje miesto na trhu. Ako to urobíte zo zeme? Q17. Ako sa rozhodnete, ktoré verzie dvoch algoritmov prudkého nárastu cien pracujú lepšie pre ktorúkoľvek leteckú spoločnosť? Q18. Aká je miera voľnosti pre laso? Q19. Aký je rozdiel medzi iterátorom, generátorom a porozumením zoznamu v Pythone? Q20. Ako otestujete novú funkciu webu vzhľadom na súbor webových stránok a zmien na webe, aby ste zistili, či zmena funguje pozitívne? Q21. Ak vezmete maticu dimenzie MxN, pričom každá bunka obsahuje abecedu, zistite, či je v nej reťazec alebo nie. Q22. Ako vytvoríte systém ukladania do vyrovnávacej pamäte pomocou pokrokovej dátovej štruktúry, ako je hashmap? Q23. Ak by ste mohli získať súbor údajov o ľubovoľnej téme, ktorá vás zaujíma, bez ohľadu na spôsoby zberu alebo zdroje, ako by potom súbor údajov vyzeral a čo s ním urobíte? Q24. Čo sú metódy zisťovania anomálií? Q25. Ako funguje ukladanie do pamäte cache a ako ho používate v oblasti dátovej vedy? Takže, týmto sa dostávame ku koncu tohto článku. Dotazy na rozhovor s Google Data Science sú väčšinou založený na scenári a vyžadovať, aby ste mali Schopnosti riešenia problémov a navyše musíte vedieť, ako aplikovať Data Science na tieto situácie. Dúfam, že vám to dá perspektívu byť pripravení na akýkoľvek rozhovor o vede v budúcnosti. Či už je to Google, Microsoft, Apple alebo Uber. Všetci technickí giganti kladú podobné typy otázok, pokiaľ ide o dátovú vedu, pretože ide o rozsiahlu a zároveň novú oblasť. vám umožní ovládať nástroje a systémy používané profesionálmi v odbore Data Science Professionals. Zahŕňa školenie v oblasti štatistík, Data Science, Python, Apache Spark & ​​Scala, Tensorflow a Tableau. Učebné osnovy boli určené rozsiahlym výskumom viac ako 5 000 popisov pracovných pozícií po celom svete. Ak máte akékoľvek otázky, neváhajte spomenúť v sekcii komentárov nižšie.