A tudás ma már ingyen hever az interneten. A legjobb GitHub adattárak segítenek elindulni az algoritmusok világában. Ebben a listában összegyűjtöttük a legnépszerűbb forrásokat kezdőknek és haladóknak egyaránt. Itt találsz kódpéldákat és elméleti anyagokat is.
1. TensorFlow Examples
Ez a gyűjtemény a Google keretrendszerének gyakorlati oldalát mutatja be. Kezdőknek ideális a sok egyszerű példa miatt. A tároló tartalmazza a klasszikus modellek megvalósítását Python nyelven.
Így definiálhatsz egy egyszerű műveletet a segítségével.
import tensorflow as tf
# Két konstans létrehozása
a = tf.constant(2)
b = tf.constant(3)
# Összeadás végrehajtása
c = tf.add(a, b)
print(c)
A példák között találsz neurális hálókat és képfelismerőket is.
Link: TensorFlow Examples
2. PyTorch Examples
A kutatók kedvenc eszközéhez tartozó hivatalos példatár. Ez a lista lefedi a legfontosabb területeket a szövegfeldolgozástól a képalkotásig. A kódok tiszták és jól követhetők.
Nézd meg milyen egyszerű egy tenzor létrehozása.
import torch
# Véletlenszerű tenzor
x = torch.rand(5, 3)
print(x)
# GPU ellenőrzése
if torch.cuda.is_available():
x = x.to('cuda')
A tároló segít megérteni a dinamikus számítási gráfok működését.
Link: PyTorch Examples
3. Awesome Machine Learning
Ez nem egy kódtár hanem egy hatalmas linkgyűjtemény. Tematikusan rendezi a legjobb eszközöket és könyvtárakat. Itt nyelvenként bontva találod meg a forrásokat.
A tartalma folyamatosan frissül a közösség által. Ha keresel egy speciális könyvtárat Rust vagy Go nyelven akkor itt biztosan megtalálod.
Link: Awesome Machine Learning
4. Scikit-learn
A klasszikus adatbányászati feladatok alapköve. Ez a tároló tartalmazza magát a forráskódot és a dokumentációt is. Kezdőknek a examples mappa átnézése kötelező.
Így taníthatsz be egy döntési fát pár sorban.
from sklearn import tree
X = [[0, 0], [1, 1]]
Y = [0, 1]
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X, Y)
print(clf.predict([[2., 2.]]))
A könyvtár a felügyelt és felügyelet nélküli tanulást is támogatja.
Link: Scikit-learn
5. Keras
Ez a magas szintű API teszi lehetővé a gyors prototípus készítést. A tárolóban rengeteg előre megírt modellt találsz. A kódbázis tanulmányozása segít megérteni a mélytanulás absztrakcióit.
Egy egyszerű szekvenciális modell így épül fel.
from keras.models import Sequential
from keras.layers import Dense
model = Sequential()
model.add(Dense(units=64, activation='relu', input_dim=100))
model.add(Dense(units=10, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='sgd')
Ma már gyakran a TensorFlow részeként használják.
Link: Keras
6. FastAI
A céljuk a technológia demokratizálása. A könyvtár egyszerűsíti a legbonyolultabb modellek betanítását is. A hozzá tartozó ingyenes kurzus világhírű.
Pár sorral csúcsminőségű eredményt érhetsz el.
from fastai.vision.all import *
path = untar_data(URLs.PETS)
dls = ImageDataLoaders.from_name_func(
path, get_image_files(path), valid_pct=0.2, seed=42,
label_func=is_cat, item_tfms=Resize(224))
learn = vision_learner(dls, resnet34, metrics=error_rate)
learn.fine_tune(1)
A filozófiájuk a gyakorlatra helyezi a hangsúlyt az elmélet helyett.
Link: FastAI
7. Roadmap
Ez a tároló az elméleti alapozásban segít. Rendszerbe foglalja a legfontosabb tudományos publikációkat. Ha érteni akarod a modellek matematikáját akkor ez a te térképed.
A lista nehézségi szintek és témák szerint van csoportosítva. Kezdve a 90-es évek alapműveitől egészen a mai transzformerekig.
Link: Roadmap
8. Study Plan
Sok fejlesztő szeretne profilt váltani. Ez a tároló kifejezetten szoftvermérnököknek készült tanulási terv. Hónapokra lebontva mutatja az utat a nulláról a munkavállalásig.
A terv tartalmazza a szükséges matematikai alapokat és a kódolási feladatokat is.
Link: Study Plan
9. CS229
A Stanford Egyetem híres kurzusának jegyzetei. Ez a forrás tömör összefoglalókat tartalmaz a legfontosabb fogalmakról. Vizsgára készüléshez vagy gyors ismétléshez kiváló.
A matematikai képletek és definíciók itt vannak a legjobban elmagyarázva.
Link: CS229
10. Homemade Machine Learning
A legjobb módja a tanulásnak az építés. Ez a projekt Python nyelven valósítja meg a népszerű algoritmusokat külső könyvtárak nélkül. Csak a matematikát és a kódot látod meztelenül.
Így néz ki a lineáris regresszió logikája a mélyben.
import numpy as np
def step_gradient(b_current, m_current, data, learningRate):
b_gradient = 0
m_gradient = 0
N = float(len(data))
for i in range(0, len(data)):
x = data[i, 0]
y = data[i, 1]
b_gradient += -(2/N) * (y - ((m_current * x) + b_current))
m_gradient += -(2/N) * x * (y - ((m_current * x) + b_current))
new_b = b_current - (learningRate * b_gradient)
new_m = m_current - (learningRate * m_gradient)
return [new_b, new_m]
Ez segít megérteni mi történik a dobozon belül.
Link: Homemade ML
Összefoglaló táblázat
A lista segít a választásban a céljaid szerint.
| Tároló neve | Fókusz | Szint |
| TensorFlow Examples | Gyakorlati kódok | Kezdő |
| PyTorch Examples | Kutatás és fejlesztés | Közepes |
| Awesome ML | Forrásgyűjtemény | Mindenki |
| Scikit-learn | Klasszikus modellek | Kezdő |
| Keras | Gyors építés | Kezdő |
| FastAI | Top eredmények könnyen | Kezdő |
| Papers Roadmap | Tudományos háttér | Profi |
| ML for Engineers | Karrierváltás | Közepes |
| CS229 | Matematikai alapok | Egyetemi |
| Homemade ML | Algoritmusok belülről | Haladó |
Böngészd át a GitHub adattárlókról összeállított listát. A forráskód olvasása sokszor többet ér, mint bármelyik tankönyv.




