Výukový program pre Python Seaborn: Čo je Seaborn a ako ho používať?



Výukový program pre Python Seaborn o rozdieloch medzi seaborn a matplotlib. Dozviete sa tiež o rôznych funkciách a prispôsobeniach dostupných v Seaborn.

Python je skladiskom mnohých nesmierne výkonných knižníc a rámcov. Medzi nimi je Seaborn, ktorá je dominantou vizualizácia údajov knižnica, čo programátorom poskytuje ďalší dôvod . V tomto výučbovom programe pre Python Seaborn sa budete opierať o všetky vizualizácie dát pomocou programu Seaborn.

Predtým, ako sa posunieme ďalej, pozrime sa na všetky témy diskusie v tomto článku:





Začnime teda najskôr vysvetlením dôležitosti Pythona Seaborna.

Prečo používať Python Seaborn?

Ako už bolo spomenuté, knižnica Python Seaborn sa používa na uľahčenie náročnej úlohy vizualizácie údajov a je na nej založená . Seaborn umožňuje vytváranie štatistických grafík pomocou nasledujúcich funkcií:



  • Rozhranie API založené na množinách údajov, ktoré umožňuje porovnanie viacerých premenné

  • Podporuje mriežky s viacerými grafmi, ktoré zase uľahčujú vytváranie zložitých vizualizácií

  • Dostupné jednorozmerné a dvojrozmerné vizualizácie na porovnanie medzi podmnožinami údajov



  • Dostupnosť rôznych farebných paliet na odhalenie rôznych druhov vzorov

  • Odhady a pozemky automaticky

Ak ste sa teda pýtali, prečo používať Seaborn, keď už máte Matplotlib, tu je odpoveď na tento problém.

Python Seaborn vs Matplotlib:

„Ak sa Matplotlib„ snaží uľahčiť ľahké veci a urobiť ťažké veci možnými “, snaží sa seaborn uľahčiť aj presne definovaný súbor ťažkých vecí“ - Michael Waskom (tvorca Seaborn).
Matplotlib je v skutočnosti dobrý, ale Seaborn je lepší. V zásade existujú dva nedostatky Matplotlibu, ktoré Seaborn opravuje:

  1. Matplotlib je možné prispôsobiť, ale je ťažké zistiť, aké nastavenia sú potrebné na zatraktívnenie grafov. Na druhú stranu, Seaborn prichádza s mnohými prispôsobenými témami a rozhraniami na vysokej úrovni, aby tento problém vyriešil.

  2. Pri práci s Pandy Matplotlib nefunguje dobre, keď sa jedná o DataFrames, zatiaľ čo funkcie Seaborn skutočne fungujú na DataFrames.

Ako nainštalovať Seaborn?

Ak chcete nainštalovať knižnicu Python Seaborn, môžete použiť nasledujúce príkazy založené na platforme, ktorú používate:

pip nainštalovať seaborn

alebo

nainštalovať seaborn

Po nainštalovaní stačí nainštalovať balíčky a knižnice, na ktorých je Seaborn závislý.

Inštalácia závislostí Python Seaborn:

Povinné závislosti pre morské narodenie sú:

Existuje aj jedna odporúčaná závislosť, ktorá je:

  • štátne modely

Ak chcete nainštalovať tieto knižnice, môžete použiť rovnaké príkazy ako predtým uvedené pre Seaborn s príslušnými názvami. Po inštalácii sa dajú ľahko importovať. Seaborn vám umožňuje načítať ľubovoľné súbory údajov z pomocou load_dataset () funkcie. Všetky dostupné množiny údajov môžete tiež zobraziť pomocou funkcie get_dataset_names () takto:

PRÍKLAD:

importovať seaborn ako sns sns.get_dataset_names ()

Týmto sa vráti zoznam všetkých dostupných súborov údajov.
Teraz, keď ste nastavili svoje prostredie pre prácu s seaborn, poďme ďalej a uvidíme, ako sa budú používať jeho funkcie vykreslenia v .

Seaborn plotrovacie funkcie

Vizualizácia štatistických vzťahov:

Proces porozumenia vzťahov medzi premennými množiny údajov a toho, ako tieto vzťahy závisia od iných premenných, sa nazýva štatistická analýza. Pozrime sa teraz podrobnejšie na funkcie potrebné na to:

relplot ():

Toto je funkcia na úrovni figúrky, ktorá na vizualizáciu štatistických vzťahov využíva ďalšie dve funkcie osí:

  • bodový diagram()
  • lineplot ()

Tieto funkcie je možné určiť pomocou parametra ‘kind’ parametra relplot (). V prípade, že je daný tento parameter, použije sa predvolený parameter scatterplot (). Predtým, ako začnete písať kód, nezabudnite importovať požadované knižnice nasledovne:

importovať numpy ako np importovať pandy ako pd importovať matplotlib.pyplot ako plt importovať sa ako sns sns.set (style = 'darkgrid')

Upozorňujeme, že atribút style je tiež prispôsobiteľný a môže mať akúkoľvek hodnotu, napríklad darkgrid, ticks, atď., Ktorým sa budem venovať neskôr v časti plot-estetika. Pozrime sa teraz na malý príklad:

PRÍKLAD:

f = sns.load_dataset ('lety') sns.relplot (x = 'cestujúci', y = 'mesiac', data = f)

VÝKON:

Výukový program Flights1-Python Seaborn-Edureka

Ako vidíte, body sú vykreslené v 2-rozmeroch. Môžete však pridať ďalšiu dimenziu pomocou sémantiky „odtieň“. Pozrime sa na príklad toho istého:

PRÍKLAD:

vzdialené vyvolanie metódy java príklad
f = sns.load_dataset („lety“) sns.relplot (x = „cestujúci“, y = „mesiac“, odtieň = „rok“, údaje = f)

Uvidíte nasledujúci výstup:

VÝKON:

Existuje však oveľa viac prispôsobení, ktoré môžete vyskúšať, ako sú farby, štýly, veľkosť atď. V nasledujúcom príklade ukážem, ako môžete zmeniť farbu:

PRÍKLAD:

sns.set (style = 'darkgrid') f = sns.load_dataset ('lety') sns.relplot (x = 'cestujúci', y = 'mesiac', odtieň = 'rok', paleta = 'ch: r = - 0,5, l = 0,75 ', údaje = f)

VÝKON:

lineplot ():

Táto funkcia vám umožní nakresliť súvislú čiaru pre vaše údaje. Túto funkciu môžete použiť tak, že zmeníte parameter „kind“ nasledovne:

PRÍKLAD:

a = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Oblečenie' : [13,40,34,23,54,67,98], „Potreby“: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) g = sns.relplot (x = 'Deň', y = 'Oblečenie', druh = 'linka', dáta = a) g.fig.autofmt_xdate ()

VÝKON:

Predvolená hodnota pre lineplot je y ako funkcia x. Môže sa to však zmeniť, ak si to želáte. Existuje mnoho ďalších možností, ktoré môžete ďalej vyskúšať.

Poďme sa teraz pozrieť na to, ako vykresliť kategorické údaje.

Vykreslenie s kategorickými údajmi:

Tento prístup prichádza do obrazu, keď je naša hlavná premenná ďalej rozdelená do samostatných skupín (kategorických). To sa dá dosiahnuť pomocou funkcie catplot ().

catplot ():

Toto je funkcia na úrovni figúrok ako relplot (). Možno ho charakterizovať tromi rodinami funkcií na úrovni osí, a to:

  1. Scatterplots - Patria sem stripplot (), swarmplot ()

  2. Distribučné grafy - ktoré sú boxplot (), violinplot (), boxenplot ()

  3. Estimateplots - konkrétne pointplot (), barplot (), countplot ()

Ukážme si teraz niekoľko príkladov:

PRÍKLAD:

importovať seaborn ako sns import matplotlib.pyplot ako plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tipy') sns.catplot (x = 'deň', y = 'total_bill', údaje = a)

VÝKON:

Ako vidíte, vo vyššie uvedenom príklade som nenastavil parameter ‘kind’. Preto vrátil graf ako predvolený bodový graf. Môžete určiť ktorúkoľvek z funkcií úrovne osí, aby ste mohli graf podľa potreby meniť. Uveďme si tiež príklad:

PRÍKLAD:

importovať seaborn ako sns import matplotlib.pyplot ako plt sns.set (style = 'ticks', color_codes = True) a = sns.load_dataset ('tipy') sns.catplot (x = 'deň', y = 'total_bill', kind = 'husle', data = a)

VÝKON:

Vyššie uvedený výstup zobrazuje husľový graf pre množinu údajov o tipoch. Teraz sa pokúsime nájsť spôsob, ako vizualizovať distribúciu množiny údajov.

Vizualizácia distribúcie množiny údajov:

Toto sa v zásade zaoberá porozumením množinám údajov v kontexte s jednorozmerným alebo dvojrozmerným. Predtým, ako s tým začnete, stačí importovať nasledovné:

importovať numpy ako np importovať pandy ako pd importovať sa do mora ako sns importovať matplotlib.pyplot ako plt zo scipy importovať štatistiky sns.set (color_codes = True)

Po dokončení môžete pokračovať v vykresľovaní jednorozmerných a dvojrozmerných distribúcií.

Vynesenie jednorozmerných distribúcií:

Na ich vykreslenie môžete použiť funkciu distplot () nasledovne:

PRÍKLAD:

a = np.random.normal (loc = 5, veľkosť = 100, mierka = 2) sns.distplot (a)

VÝKON:

Ako vidíte vo vyššie uvedenom príklade, do premennej a, ktorej hodnoty sú generované funkciou normal (), sme pomocou grafu vykreslili graf.

Vynesenie dvojrozmerných distribúcií:

Toto sa prejaví, keď máte dve náhodné nezávislé premenné, ktorých výsledkom je pravdepodobná udalosť. Najlepšou funkciou na vykreslenie týchto typov grafov je jointplot (). Poďme teraz nakresliť dvojrozmerný graf pomocou jointplot ().

PRÍKLAD:

x = pd.DataFrame ({'Day': [1,2,3,4,5,6,7], 'Grocery': [30,80,45,23,51,46,76], 'Oblečenie' : [13,40,34,23,54,67,98], „Potreby“: [12,32,27,56,87,54,34]}, index = [1,2,3,4,5 , 6,7]) y = pd.DataFrame ({'Day': [8,9,10,11,12,13,14], 'Potraviny': [30,80,45,23,51,46, 76], „Oblečenie“: [13,40,34,23,54,67,98], „Pomôcky“: [12,32,27,56,87,54,34]}, index = [8,9 , 10,11,12,13,14]) priemer, cov = [0, 1], [(1, 0,5), (, 5, 1)] data = np.random.multivariate_normal (priemer, cov, 200 ) s sns.axes_style ('biela'): sns.jointplot (x = x, y = y, kind = 'kde', color = 'b')

VÝKON:

Teraz, keď ste pochopili rôzne funkcie v Python Seaborn, poďme k vytvoreniu štruktúrovaných viacplotových mriežok.

Multi-plot mriežky:

Python Seaborn umožňuje vykreslenie viacerých mriežok vedľa seba. V zásade ide o grafy alebo grafy, ktoré sú vykreslené pomocou rovnakej mierky a osí, aby sa uľahčilo ich vzájomné porovnanie. To zase pomáha programátorovi rýchlo rozlišovať medzi grafmi a získavať veľké množstvo informácií.

Zvážte nasledujúci príklad funkcie facetgrid () na vykreslenie týchto grafov.

PRÍKLAD:

sns.set (style = 'darkgrid') a = sns.load_dataset ('iris') b = sns.FacetGrid (a, col = 'species') b.map (plt.hist, 'sepal_length')

VÝKON:

Vyššie uvedený výstup jasne ukazuje porovnanie tipov, ktoré sa podávajú počas obeda a večere. Ak máte na porovnanie pár premenných, môžete tiež vykresliť funkciu PairGrid. Uvažujme o nasledujúcom príklade.

PRÍKLAD:

sns.set (style = 'ticks') a = sns.load_dataset ('flight') b = sns.PairGrid (a) b.map (plt.scatter)

VÝKON:

Ako vidíte, vyššie uvedený výstup rôznymi spôsobmi jasne porovnáva rok a počet cestujúcich.

Seaborn tiež umožňuje úpravy týkajúce sa estetiky, o ktorej sa diskutuje ďalej.

Estetika zápletky:

Tento segment výučby Python Seaborn sa zaoberá zvyšovaním atraktívnosti a rozkošnosti našich grafov.

Estetika figúr Seaborn

Prvá funkcia, o ktorej budem diskutovať, je nastavená (). Parameter ‘štýl’ tejto funkcie som používal už skôr. Tento parameter sa v zásade zaoberá morskými témami. V súčasnosti je ich k dispozícii päť, a to darkgrid, ticks, whitegrid, white and dark.

Zvážte nasledujúci príklad demonštrujúci bielu tému.

PRÍKLAD:

importovať seaborn ako sns import matplotlib.pyplot ako plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tipy') sns.boxplot (x = 'deň', y = 'total_bill', údaje = a)

VÝKON:

Vo vyššie uvedenom výstupe si môžete všimnúť, že téma je zmenená na bielu. Môžete ich ďalej preskúmať aj pomocou ďalších tém. Ak si všimnete v predchádzajúcom výstupe, okolo grafu sú osi. To je však tiež možné prispôsobiť pomocou funkcie despine (). Pozrite sa na príklad nižšie.

PRÍKLAD:

importovať seaborn ako sns import matplotlib.pyplot ako plt sns.set (style = 'white', color_codes = True) a = sns.load_dataset ('tipy') sns.boxplot (x = 'deň', y = 'total_bill', data = a) sns.despine (offset = 10, trim = True)

VÝKON:



Všimnite si rozdiel medzi predchádzajúcimi dvoma výstupmi. Existuje však oveľa viac možností, ktoré môžete preskúmať sami.

Palety farieb Python Seaborn:

Farba je v podstate vlastnosť, ktorá približuje ľudské oči nad rámec akejkoľvek inej vlastnosti. Seaborn vám umožňuje hrať sa s farbami pomocou rôznych funkcií, ako sú color_palette (), hls_palette (), husl_palette () atď. Prezrite si farby, ktoré sú momentálne v seaborn k dispozícii.

PRÍKLAD:

import numpy ako np import seaborn ako sns import matplotlib.pyplot ako plt sns.set () presentcolors = sns.color_palette () sns.palplot (presentcolors)

VÝKON:

Vyššie uvedený obrázok zobrazuje farby, ktoré sú prítomné v Seaborn. Urobil som to pomocou funkcie palplot (). Pre hlbšie variácie môžete použiť hls_palette (), husl_palette () atď.

Týmto sa dostávame na koniec výučby programu Python Seaborn. Dúfam, že ste všetko pochopili jasne. Určite cvičte čo najviac .

Máte na nás otázku? Uveďte to, prosím, v sekcii komentárov tohto blogu „Výukový program pre Python Seaborn“ a my sa vám ozveme čo najskôr.

Ak chcete získať podrobné informácie o Pythone a jeho rôznych aplikáciách, môžete sa zaregistrovať naživo s nepretržitou podporou a doživotným prístupom.