10 ingyenes GitHub tároló a gépi tanulás elsajátításához

A tudás ma már ingyen hever az interneten. A legjobb GitHub adattárak segítenek elindulni az algoritmusok világában. Ebben a listában összegyűjtöttük a legnépszerűbb forrásokat kezdőknek és haladóknak egyaránt. Itt találsz kódpéldákat és elméleti anyagokat is.

1. TensorFlow Examples

Ez a gyűjtemény a Google keretrendszerének gyakorlati oldalát mutatja be. Kezdőknek ideális a sok egyszerű példa miatt. A tároló tartalmazza a klasszikus modellek megvalósítását Python nyelven.

Így definiálhatsz egy egyszerű műveletet a segítségével.

import tensorflow as tf

# Két konstans létrehozása
a = tf.constant(2)
b = tf.constant(3)

# Összeadás végrehajtása
c = tf.add(a, b)
print(c)

A példák között találsz neurális hálókat és képfelismerőket is.

Link: TensorFlow Examples

2. PyTorch Examples

A kutatók kedvenc eszközéhez tartozó hivatalos példatár. Ez a lista lefedi a legfontosabb területeket a szövegfeldolgozástól a képalkotásig. A kódok tiszták és jól követhetők.

Nézd meg milyen egyszerű egy tenzor létrehozása.

import torch

# Véletlenszerű tenzor
x = torch.rand(5, 3)
print(x)

# GPU ellenőrzése
if torch.cuda.is_available():
    x = x.to('cuda')

A tároló segít megérteni a dinamikus számítási gráfok működését.

Link: PyTorch Examples

3. Awesome Machine Learning

Ez nem egy kódtár hanem egy hatalmas linkgyűjtemény. Tematikusan rendezi a legjobb eszközöket és könyvtárakat. Itt nyelvenként bontva találod meg a forrásokat.

A tartalma folyamatosan frissül a közösség által. Ha keresel egy speciális könyvtárat Rust vagy Go nyelven akkor itt biztosan megtalálod.

Link: Awesome Machine Learning

4. Scikit-learn

A klasszikus adatbányászati feladatok alapköve. Ez a tároló tartalmazza magát a forráskódot és a dokumentációt is. Kezdőknek a examples mappa átnézése kötelező.

Így taníthatsz be egy döntési fát pár sorban.

from sklearn import tree

X = [[0, 0], [1, 1]]
Y = [0, 1]

clf = tree.DecisionTreeClassifier()
clf = clf.fit(X, Y)

print(clf.predict([[2., 2.]]))

A könyvtár a felügyelt és felügyelet nélküli tanulást is támogatja.

Link: Scikit-learn

5. Keras

Ez a magas szintű API teszi lehetővé a gyors prototípus készítést. A tárolóban rengeteg előre megírt modellt találsz. A kódbázis tanulmányozása segít megérteni a mélytanulás absztrakcióit.

Egy egyszerű szekvenciális modell így épül fel.

from keras.models import Sequential
from keras.layers import Dense

model = Sequential()
model.add(Dense(units=64, activation='relu', input_dim=100))
model.add(Dense(units=10, activation='softmax'))

model.compile(loss='categorical_crossentropy', optimizer='sgd')

Ma már gyakran a TensorFlow részeként használják.

Link: Keras

6. FastAI

A céljuk a technológia demokratizálása. A könyvtár egyszerűsíti a legbonyolultabb modellek betanítását is. A hozzá tartozó ingyenes kurzus világhírű.

Pár sorral csúcsminőségű eredményt érhetsz el.

from fastai.vision.all import *

path = untar_data(URLs.PETS)
dls = ImageDataLoaders.from_name_func(
    path, get_image_files(path), valid_pct=0.2, seed=42,
    label_func=is_cat, item_tfms=Resize(224))

learn = vision_learner(dls, resnet34, metrics=error_rate)
learn.fine_tune(1)

A filozófiájuk a gyakorlatra helyezi a hangsúlyt az elmélet helyett.

Link: FastAI

7. Roadmap

Ez a tároló az elméleti alapozásban segít. Rendszerbe foglalja a legfontosabb tudományos publikációkat. Ha érteni akarod a modellek matematikáját akkor ez a te térképed.

A lista nehézségi szintek és témák szerint van csoportosítva. Kezdve a 90-es évek alapműveitől egészen a mai transzformerekig.

Link: Roadmap

8. Study Plan

Sok fejlesztő szeretne profilt váltani. Ez a tároló kifejezetten szoftvermérnököknek készült tanulási terv. Hónapokra lebontva mutatja az utat a nulláról a munkavállalásig.

A terv tartalmazza a szükséges matematikai alapokat és a kódolási feladatokat is.

Link: Study Plan

9. CS229

A Stanford Egyetem híres kurzusának jegyzetei. Ez a forrás tömör összefoglalókat tartalmaz a legfontosabb fogalmakról. Vizsgára készüléshez vagy gyors ismétléshez kiváló.

A matematikai képletek és definíciók itt vannak a legjobban elmagyarázva.

Link: CS229

10. Homemade Machine Learning

A legjobb módja a tanulásnak az építés. Ez a projekt Python nyelven valósítja meg a népszerű algoritmusokat külső könyvtárak nélkül. Csak a matematikát és a kódot látod meztelenül.

Így néz ki a lineáris regresszió logikája a mélyben.

import numpy as np

def step_gradient(b_current, m_current, data, learningRate):
    b_gradient = 0
    m_gradient = 0
    N = float(len(data))
    for i in range(0, len(data)):
        x = data[i, 0]
        y = data[i, 1]
        b_gradient += -(2/N) * (y - ((m_current * x) + b_current))
        m_gradient += -(2/N) * x * (y - ((m_current * x) + b_current))
    new_b = b_current - (learningRate * b_gradient)
    new_m = m_current - (learningRate * m_gradient)
    return [new_b, new_m]

Ez segít megérteni mi történik a dobozon belül.

Link: Homemade ML

Összefoglaló táblázat

A lista segít a választásban a céljaid szerint.

Tároló neveFókuszSzint
TensorFlow ExamplesGyakorlati kódokKezdő
PyTorch ExamplesKutatás és fejlesztésKözepes
Awesome MLForrásgyűjteményMindenki
Scikit-learnKlasszikus modellekKezdő
KerasGyors építésKezdő
FastAITop eredmények könnyenKezdő
Papers RoadmapTudományos háttérProfi
ML for EngineersKarrierváltásKözepes
CS229Matematikai alapokEgyetemi
Homemade MLAlgoritmusok belülrőlHaladó

Böngészd át a GitHub adattárlókról összeállított listát. A forráskód olvasása sokszor többet ér, mint bármelyik tankönyv.

Kérjük, ellenőrizd a mező formátumát, és próbáld újra.
Köszönjük, hogy feliratkoztál.

vagyunk.hu hírlevél

Hozzászólás

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük