AI projektek skálázása Dataiku Cobuild használatával a Snowflake-en
💼 Üzlet How-To

AI projektek skálázása Dataiku Cobuild használatával a Snowflake-en

Lépésről lépésre útmutató a vállalati AI építéséhez, irányításához és telepítéséhez a Dataiku Cobuild funkciójának segítségével a Snowflake adatplatformon.

AI projektek skálázása Dataiku Cobuild használatával a Snowflake-en

Bevezetés: Képzeld el, hogy épp most kaptál egy hegyre való ügyféladatot, és gyorsan szükséged van az elemzésekre, de a meglévő táblázatok megfojtják a csapatodat. A megfelelő eszközök kombinációjával megbízható AI-előrejelzésekké alakíthatod az adatokat anélkül, hogy táblázatokban vagy kódban fulladnál meg.

1️⃣ Készítsd elő az alapokat

Mielőtt az AI varázslat elkezdődik, szilárd alapokra van szükséged. Gondolj a Snowflake-re úgy, mint egy hatalmas, felhő alapú tárolórekeszre, amely bármilyen mennyiségű adatot képes tárolni, és azonnal kiszolgálni azt az arra jogosult felhasználóknak.

  1. Hozz létre egy Snowflake fiókot – regisztrálj az ingyenes próbaverzióra, vagy használd a szervezeted felhő-előfizetését.
  2. Állíts be egy adatbázist és egy sémát – ezek csak mappák, amelyek rendszerezve tartják a táblázataidat.
  3. Töltsd be az adataidat – importálj CSV-ket, csatlakozz a CRM-edhez, vagy futtass egy egyszerű COPY INTO parancsot (a Snowflake módszere az adatok külső tárolóból a raktárba mozgatására).

Tipp: Tarts be egy elnevezési konvenciót (pl. sales_2024_q1), hogy később gyorsan megtaláld a táblázatokat.

2️⃣ Csatlakoztasd a Dataikut a Snowflake-hez

A Dataiku egy adatelemző platform, amely vizuális munkafolyamatok segítségével lehetővé teszi nem programozók számára is AI-modellek építését. Amikor először hallod a „Dataiku” szót, gondolj egy konyhára, ahol a séf (te) összekeverheti az összetevőket (adatokat) anélkül, hogy pontosan ismerné a recept kódját.

  1. Telepítsd a Snowflake plugint a Dataikuba – ez egy előre elkészített csatlakozó, amely a Snowflake nyelvén „beszél”.
  2. Add meg a Snowflake hitelesítő adataidat – felhasználónév, jelszó és a raktár URL-je. A Dataiku biztonságosan tárolja őket.
  3. Teszteld a kapcsolatot – A Dataiku lekéri a táblázatok listáját, így megerősítheted, hogy minden működik.

3️⃣ Használd a Cobuildot AI-modellek létrehozásához

A Cobuild a Dataiku „kód nélküli” modellépítője. Automatikusan javasolja a legjobb algoritmust (mint egy szakácskönyv, amely egy torta ízét ajánlja) a bevitt adatok alapján.

  1. Hozz létre egy új Cobuild projektet – válaszd az „AI model” (AI modell) lehetőséget, és irányítsd egy korábban betöltött Snowflake táblára.
  2. Határozd meg a céloszlopot – azt a mezőt, amelyet a modellnek előre kell jeleznie (pl. churn_status).
  3. Válassz ki jellemzőket – hagyd, hogy a Cobuild automatikusan felismerje a releváns oszlopokat, vagy kézzel válassz ki néhányat (pl. last_purchase_date, region).
  4. Indítsd el a betanítást – A Cobuild felosztja az adatokat betanító és tesztelő halmazokra, betanít több algoritmust, és kiválasztja a legjobban teljesítőt.

Mi történik a színfalak mögött? A Cobuild egy nagy nyelvi modellt (LLM) használ az utasításaid értelmezéséhez, és egy transzformer architektúrát (gondolj rá úgy, mint az AI belső agyára, amely odafigyel a fontos szavakra) az előrejelző modell felépítéséhez.

4️⃣ Irányítás, vizualizáció és ellenőrzés

A vállalati AI-nak szabályokra van szüksége, hogy mindenki megbízzon az eredményben. A Dataiku beépített irányítási eszközöket kínál, amelyek úgy működnek, mint egy adatforgalom-rendőr.

  • Verziókövetés – minden modell iterációt elment, így visszaállíthatsz egy korábbi verziót, ha egy változtatás rontja a pontosságot.
  • Hozzáférési jogok – olvasható vagy szerkesztési jogosultságokat rendelhetsz felhasználónként vagy csapatonként.
  • Modellkártyák – automatikusan generált dokumentáció, amely elmagyarázza, milyen adatokat használtak, hogyan lett a modell betanítva, és milyen teljesítménymutatókkal rendelkezik.

A Snowflake további láthatóságot biztosít a lekérdezési előzmények és az auditnaplók segítségével – láthatod, ki mikor és melyik táblázathoz fért hozzá, így megfelelve a legtöbb megfelelőségi követelménynek.

5️⃣ Telepítés és felügyelet

Amint a modell átmegy az ellenőrzésen, egyetlen kattintással élesítheted (termelésbe küldheted). A Dataiku REST API-ként (egy webcímként, amelyet más szoftverek meghívhatnak) exportálja a modellt, és regisztrálja a Snowflake External Functions (külső függvények) funkciójában – ez egy olyan funkció, amely lehetővé teszi a Snowflake számára, hogy közvetlenül SQL lekérdezéseken belül futtassa a modellt.

  1. Hozz létre egy API végpontot – A Dataiku generál egy URL-t, például https://mycompany.dataiku.io/api/v1/predict.
  2. Regisztráld a végpontot a Snowflake-ben – használd a CREATE EXTERNAL FUNCTION parancsot; most már közvetlenül meghívhatod a predict_churn(customer_id) függvényt egy Snowflake lekérdezésből.
  3. Riasztások beállítása – A Dataiku felügyeleti műszerfala e-mailt küldhet neked, ha a modell pontossága az általad meghatározott küszöb alá esik.

Mit jelent ez számodra

  • Ha kis- vagy középvállalkozást vezetsz: egy hétvége alatt prototípust készíthetsz egy lemorzsolódás-előrejelző modellről, majd skálázhatod azt több ezer ügyfélre anélkül, hogy teljes munkaidős adatszakértőt kellene felvenned.
  • Ha nagyobb vállalatot vezetsz: a Snowflake biztonságos adattavának és a Dataiku irányítási csomagjának kombinációja auditra kész AI-folyamatokat biztosít, amelyek megfelelnek a belső és szabályozási előírásoknak.
  • Ha még új vagy az AI világában: kezdj egyetlen táblázattal, hagyd, hogy a Cobuild válassza ki az algoritmust, és nézd meg, hogyan magyarázza el a platform az egyes lépéseket. Nincs szükség kódolásra, csak kíváncsiságra.

Összefoglalás

Az AI skálázása nem kell, hogy technikai labirintus

✦ Az AI World Co. saját AI-szerkesztősége által írt eredeti cikk. Pontosságra és érthetőségre ellenőrizve.

← Vissza a hírekhez