Az adatvilág gyorsan változik. A népszerű eszközök mellett léteznek olyan ismeretlen Python könyvtárak, amelyek megkönnyítik a munkádat. Ezekkel gyorsabb és hatékonyabb lehetsz. Most bemutatjuk a tíz legjobbat működő kódokkal.
1. Polars: A sebesség új királya
A Pandas sokáig egyeduralkodó volt. A Polars viszont Rust nyelven íródott és sokkal gyorsabb. Képes párhuzamosan feldolgozni az adatokat.
Így olvass be vele egy CSV fájlt.
import polars as pl
# Adatok betöltése
df = pl.read_csv("adatok.csv")
# Szűrés és csoportosítás
eredmeny = df.filter(
pl.col("ar") > 100
).groupby("kategoria").count()
print(eredmeny)
A szintaxis hasonlít a Pandas-hoz. A sebességkülönbség viszont hatalmas lesz nagy fájloknál.
2. Great Expectations: A minőség őre
Az adatok gyakran hibásak. Ez a könyvtár automatikusan ellenőrzi a minőséget. Nem engedi tovább a rossz adatokat a rendszerben.
Teszteld le az adataidat ezzel a kóddal.
import great_expectations as ge
df = ge.read_csv("adatok.csv")
# Elvárás: Az 'id' oszlop nem lehet üres
df.expect_column_values_to_not_be_null("id")
# Elvárás: Az ár legyen 0 és 1000 között
df.expect_column_values_to_be_between("ar", 0, 1000)
A futtatás után egy részletes jelentést kapsz a hibákról.
3. Optuna: Paraméterek optimalizálása
A modellek finomhangolása időigényes. Az Optuna ezt a folyamatot automatizálja. Intelligens módon keresi meg a legjobb beállításokat.
Íme egy egyszerű optimalizálási példa.
import optuna
def objective(trial):
x = trial.suggest_float("x", -10, 10)
return (x - 2) ** 2
study = optuna.create_study()
study.optimize(objective, n_trials=100)
print(f"Legjobb érték: {study.best_params}")
Csak definiálnod kell a célfüggvényt. A többit a könyvtár elvégzi helyetted.
4. Kedro: Rendszerezett projektek
A kusza jupyter notebookok rémálommá válhatnak. A Kedro segít a kód rendszerezésében. Gyártási minőségű adatfolyamokat építhetsz vele.
A telepítés után így indíthatsz új projektet a terminálban.
pip install kedro
kedro new
A rendszer létrehoz egy szabványos mappaszerkezetet. Minden fájlnak meglesz a maga helye.
5. PyCaret: Gépi tanulás kevés kóddal
Nem kell mindig mindent nulláról írnod. A PyCaret automatizálja a modellek betanítását. Pár sor kóddal összehasonlíthatod a különböző algoritmusokat.
from pycaret.classification import *
# Környezet beállítása
s = setup(data, target='cel_valtozo')
# Legjobb modell keresése
best = compare_models()
Ez az eszköz rengeteg időt spórol a kísérletezési fázisban.
6. Streamlit: Webes alkalmazások percek alatt
Szeretnéd megosztani az eredményeidet másokkal? A Streamlit segítségével HTML tudás nélkül készíthetsz interaktív felületeket.
Mentsd el ezt a kódot app.py néven.
import streamlit as st
import pandas as pd
st.title("Az első adat appom")
df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
st.line_chart(df)
Indítsd el a streamlit run app.py paranccsal. Az alkalmazás megnyílik a böngésződben.
7. SHAP: Érthető magyarázatok
A fekete doboz modellek ideje lejárt. Tudnod kell, miért döntött úgy az algoritmus. A SHAP megmutatja, melyik adat mennyit nyomott a latban.
import shap
# Modell magyarázata
explainer = shap.Explainer(modell)
shap_values = explainer(adatok)
# Vízzesés diagram kirajzolása
shap.plots.waterfall(shap_values[0])
A vizualizáció segít megérteni az összefüggéseket.
8. Dask: Párhuzamos számítás
Ha az adat nem fér el a memóriában, a Dask a megoldás. Úgy működik, mint a Pandas, de több gépen is futhat egyszerre.
import dask.dataframe as dd
# Hatalmas fájl beolvasása
df = dd.read_csv('hatalmas_adat.csv')
# Számítás indítása
eredmeny = df.groupby('nev').mean().compute()
A compute() parancs hívásáig nem történik semmi. Ez optimalizálja az erőforrásokat.
9. Poetry: Függőségek kezelése
A requirements.txt fájlok gyakran okoznak gondot. A Poetry modern módon kezeli a csomagokat. Garantálja, hogy mindenkinél ugyanaz a verzió fusson.
Kezdj új projektet ezzel a paranccsal.
poetry init
poetry add pandas
A rendszer automatikusan frissíti a konfigurációs fájlokat.
10. Rich: Színes terminál
A kimenetek olvasása nem kell, hogy unalmas legyen. A Rich segítségével színes táblázatokat és folyamatjelzőket készíthetsz.
from rich.console import Console
from rich.table import Table
console = Console()
table = Table(title="Gyümölcsök")
table.add_column("Név", style="cyan")
table.add_column("Ár", style="green")
table.add_row("Alma", "500 Ft")
console.print(table)
A formázott kimenet profibb megjelenést kölcsönöz a szkriptjeidnek.
Összefoglaló táblázat
Itt láthatod, melyik eszköz mire való. Válassz a feladatodhoz illőt.
| Könyvtár | Fő funkció | Mikor használd? |
| Polars | Gyors adatkezelés | Ha a Pandas lassú |
| Great Expectations | Validáció | Adatminőség biztosítására |
| Optuna | Optimalizálás | Modell paraméterek hangolására |
| Kedro | Pipeline kezelés | Nagy projektek szervezésére |
| PyCaret | AutoML | Gyors prototípus készítéshez |
| Streamlit | Webes app | Eredmények bemutatására |
| SHAP | Magyarázhatóság | Ha érteni kell a döntést |
| Dask | Big Data | Ha kevés a RAM |
| Poetry | Csomagkezelés | Stabil környezet építéséhez |
| Rich | Formázás | Szép terminál kimenethez |
Ezek az ismeretlen Python könyvtárak 2026-ban alapvetőek lesznek. Próbáld ki a fenti kódokat, és építsd be őket a mindennapi munkádba!




