Kategoria: Insights PL

  • Vibe coding — 6 miesięcy później: co się posypało i czego nie zrobiłbym ponownie

    Vibe coding — 6 miesięcy później: co się posypało i czego nie zrobiłbym ponownie

    Kwiecień 2024. Właśnie wrzuciłem pierwszą działającą wersję naswoim.org na produkcję. Aplikacja działa. Użytkownicy mogą się logować. Dane są w Supabase. Na papierze — sukces.

    Pod maską: dwa konkurujące ze sobą design systemy, siedemnaście zduplikowanych funkcji pomocniczych rozsianych po dwunastu plikach i polityka Supabase RLS, która po cichu zawodzi w jednym konkretnym przypadku brzegowym — który odkryję dopiero za trzy tygodnie.

    Vibe coding działa. Ale zawodzi w sposób niewidoczny — aż przestaje być niewidoczny.

    Ekran z kodem w neonowym podświetleniu
    Foto: Jakub Żerdzicki / Unsplash

    Szybki kontekst: co zbudowałem

    W ciągu mniej więcej dwunastu miesięcy zbudowałem trzy aplikacje z użyciem vibe codingu — prawie bez zewnętrznych developerów:

    • naswoim.org — platforma dla inwestorów budowlanych: checklisty, budżety, dokumenty, marketplace ekspertów, mapy działek, asystent AI. Web + Android + iOS + portal admina.
    • industrverse.com — B2B SaaS do szkoleń VR w przemyśle: 7 ról użytkowników, 9 dashboardów na rolę, komunikacja real-time, gateway sesji VR, pełne API backendu.
    • marcinpaszkiewicz.com — ta strona. Astro SSR + WordPress headless. Prostsza, ale też pouczająca.

    Claude Code był moim głównym narzędziem, z okazjonalną pomocą Cursora. Napisałem w ten sposób gdzieś między 40 000 a 60 000 linii kodu produkcyjnego. Wszystko wyszło. Wszystko działa.

    Oto co zrobiłem źle.

    Błąd #1: Pozwoliłem AI wybrać architekturę

    Kiedy zaczynałem naswoim.org, opisałem projekt Claude’owi i zapytałem, jaki stack poleca. Dostałem solidną odpowiedź: React 19, Vite, Supabase, Tailwind CSS 4. Świetne wybory.

    Potem zapytałem o komponenty UI. Zaproponował MUI 7. Zgodziłem się — był szybki, miał wszystko czego potrzebowałem.

    Problem: już używałem Tailwind CSS 4. Teraz miałem dwa design systemy:

    Diagram — konflikt design systemów / design system conflict

    Tailwind CSS 4
    ▸ utility-first
    ▸ spacing: rem scale
    ▸ breakpoints: sm/md/lg/xl
    ▸ tokens: CSS vars

    każdy
    nowy ekran

    MUI 7
    ▸ component-first
    ▸ spacing: 8px grid
    ▸ breakpoints: xs/sm/md/lg
    ▸ tokens: theme object

    Dwa systemy spacingu. Dwie filozofie responsywności. Dwie warstwy CSS do utrzymania. — Two spacing systems. Two responsiveness philosophies. Two CSS layers to maintain.

    Wniosek: AI nie zna Twojej wizji na osiemnaście miesięcy do przodu. Optymalizuje pod „działające teraz”. Decyzje architekturalne — szczególnie dotyczące design systemów, modeli danych i granic modułów — muszą wychodzić od Ciebie. AI implementuje. Ty decydujesz co implementować.

    Co bym zrobił inaczej: napisał jednostronicowy dokument decyzji architekturalnych przed pierwszym promptem. Nie pełna specyfikacja — tylko: co jest jedynym źródłem prawdy o stylach? Jakie jest podejście do zarządzania stanem? Jak dzielimy moduły? Daj AI ograniczenia, nie blank permission.

    Błąd #2: AI nigdy nie mówi „nie” — i to jest niebezpieczne

    Po trzech miesiącach pracy nad industrverse backend miał 13 modułów NestJS, 7 ról użytkowników i 9 osobnych dashboardów. Każda rola miała własną logikę dostępu do danych, własny system powiadomień, własny workflow.

    Nic z tego nie było w oryginalnej specyfikacji.

    industrverse — plan MVP vs rzeczywistość

    Moduły backendu
    plan 5 → rzeczywistość 13

    Role użytkowników
    plan 3 → rzeczywistość 7

    Dashboardy
    plan 3 → rzeczywistość 9

    Każdy z tych elementów miał sens w izolacji. Problem pojawia się, gdy zsumuje się wszystkie decyzje z 11:00 wieczorem.
    Ściana pokryta kolorowymi karteczkami — efekt braku ograniczeń scope
    Foto: Jakub Żerdzicki / Unsplash

    Oto co się dzieje: masz pomysł o 23:00. Opisujesz go Claude’owi. Buduje go w dwadzieścia minut. Działa. Wrzucasz to. Trzy tygodnie później zauważasz, że dodanie tej funkcji zepsuło model mentalny dla następnej funkcji. Ale AI ci tego nie mówi — po prostu buduje to, o co go prosisz.

    Każdy developer w zespole ma kolegę, który mówi „chwila — czy na pewno tego potrzebujemy?” AI nie mówi chwila. AI mówi tak.

    Wniosek: Musisz być PM-em dla swojego AI. Nie tylko wizjonerem — osobą, która mówi nie. Pytanie nie brzmi „czy AI to zbuduje?” (zbuduje). Pytanie brzmi „czy to w ogóle powinno istnieć?”

    Mam teraz regułę przed każdą nową funkcją: piszę jedno zdanie o tym, jaki problem rozwiązuje dla konkretnego użytkownika. Jeśli nie potrafię tego zdania napisać, nie piszę promptu.

    Błąd #3: Debugowanie kodu, którego nie pisałeś, jest wolniejsze niż wygląda

    Lupa nad labiryntem — szukanie bugu w kodzie
    Foto: TSD Studio / Unsplash

    W naswoim.org miałem błąd w politykach Supabase Row Level Security. Użytkownicy w jednej roli mogli okazjonalnie widzieć dokumenty, których nie powinni — ale tylko gdy wcześniej zaszła konkretna sekwencja operacji.

    Szukanie tego zajęło mi trzy dni.

    Nie dlatego, że błąd był skomplikowany. Dlatego, że kod był generowany przez AI i nie przeczytałem go wystarczająco uważnie w momencie powstawania. Polityka RLS wyglądała poprawnie. Była poprawna składniowo. Przechodziła moje podstawowe testy. Przypadek brzegowy był subtelny — kombinacja dwóch różnych warunków polityki, które oddziaływały na siebie w nieoczywisty sposób.

    Kiedy piszesz kod sam, budujesz model mentalny w trakcie pisania. Kiedy pisze AI, recenzujesz — co jest szybsze, ale płytsze. Model w głowie jest mniej kompletny. A płytkie modele mentalne spowalniają debugowanie.

    Wniosek: Nigdy nie merguj kodu AI, którego nie potrafisz wyjaśnić linijka po linijce. W szczególności dla wszystkiego, co dotyczy auth, dostępu do danych i logiki krytycznej dla biznesu: czytaj jak code reviewer, nie jak ktoś sprawdzający listę zakupów.

    Błąd #4: Kontekst się kończy — i AI „zapomina” wszystko

    W długiej sesji Claude Code widzi wszystko, co razem zbudowaliście. Zna Twoje konwencje nazewnicze, wzorce, preferencje. Jest spójny.

    W następnej sesji zaczyna od zera.

    Schemat — pamięć kontekstu między sesjami / context memory across sessions

    Sesja 1
    ▸ React hooks
    ▸ TanStack Query
    ▸ Zustand atoms

    ↺ reset
    Sesja 2
    ▸ useEffect pattern
    ▸ local useState
    ▸ API calls inline

    ↺ reset
    Sesja 3
    ▸ custom hooks
    ▸ Context API
    ▸ Axios interceptors

    Każda sesja generowała spójny kod — ale każda sesja nie wiedziała nic o poprzedniej. — Each session generated coherent code — but knew nothing about the previous one.

    W naswoim.org zacząłem nową sesję po dwudniowej przerwie i poprosiłem Claude’a o zbudowanie nowego komponentu. Wygenerował coś, co działało — ale używało zupełnie innych wzorców niż reszta kodu. Inne podejście do zarządzania stanem. Inny styl obsługi błędów. Inne nazewnictwo.

    Po czterech miesiącach codebase miał trzy wyraźne „ery” — każda odzwierciedlająca konwencje z rozmów prowadzonych w danym czasie.

    Wniosek: Plik CLAUDE.md nie jest opcjonalny. Ustaw go pierwszego dnia. Powinien zawierać: konwencje nazewnicze, wzorce do stosowania, wzorce do unikania, których bibliotek używać do jakich problemów. To jest trwała pamięć między sesjami.

    Błąd #5: Security jest niewidoczna — dopóki nie jest

    AI generuje działający kod. Nie generuje niezawodnie bezpiecznego kodu.

    Czerwona kłódka na klawiaturze — security niewidoczna dopóki jej nie ma
    Foto: FlyD / Unsplash

    W industrverse miałem endpoint API dostępny tylko dla użytkowników z rolą „trainer”. Endpoint działał poprawnie. Zwracał właściwe dane. Obsługiwał błędy elegancko.

    Nie weryfikował też roszczenia roli JWT przy jednej konkretnej metodzie HTTP. Użytkownik z dowolnym uwierzytelnionym tokenem mógł go wywołać.

    Znalazłem to podczas ręcznego przeglądu bezpieczeństwa — nie dlatego, że Claude to oznaczył, nie dlatego, że moje testy to wyłapały. Bo pewnego popołudnia usiadłem i przeczytałem każdy endpoint związany z auth.

    Security review — checklista po każdym auth feature


    Czy każdy endpoint weryfikuje JWT/session?
    Is every endpoint verifying JWT/session?

    Czy rola użytkownika jest sprawdzana server-side?
    Is the user role checked server-side?

    Czy RLS działa dla wszystkich kombinacji ról?
    Does RLS work for all role combinations?

    Czy input jest walidowany przed zapisem do bazy?
    Is input validated before writing to DB?

    Czy wrażliwe pola są filtrowane w response?
    Are sensitive fields filtered in the response?

    Czy edge case (brak roli, wygasły token) jest obsłużony?
    Is the edge case (missing role, expired token) handled?

    Wniosek: Po każdej funkcji dotykającej autentykacji, autoryzacji lub danych użytkownika — rób ręczny przegląd bezpieczeństwa. Nie vibe. Checklista.

    Co bym zrobił inaczej: 6 reguł

    Gdybym zaczynał dzisiaj, z całą tą wiedzą:

    1
    Napisz brief architekturalny przed pierwszym promptem
    Jedna strona. Co jest jedynym źródłem prawdy o stylach? Jakie jest podejście do stanu? Jakie są granice modułów? Daj AI ograniczenia, nie blank permission.

    2
    Jeden design system. Zero wyjątków.
    Albo biblioteka komponentów, albo utility CSS. Nie obydwa. Jeśli Tailwind — wszystko Tailwind. Jeśli MUI — wszystko MUI.

    3
    Jedno zdanie problemu przed każdą nową funkcją
    „To rozwiązuje [konkretny problem] dla [konkretnego użytkownika].” Jeśli nie potrafisz tego napisać — nie jesteś gotowy na prompt.

    4
    Jeśli nie rozumiesz linijka po linijce — nie merguj
    Szczególnie dla auth, RLS, uprawnień i modeli danych. Czytaj jak code reviewer, nie jak ktoś sprawdzający listę zakupów.

    5
    CLAUDE.md od pierwszego dnia
    Konwencje nazewnicze, preferowane wzorce, biblioteki do jakich problemów, wzorce do unikania. Aktualizuj przy każdej ważnej decyzji. To trwała pamięć między sesjami.

    6
    Zaplanuj przegląd bezpieczeństwa po każdej funkcji auth
    Nie opcjonalnie. AI generuje działający kod, nie bezpieczny. Auth, RLS i walidacja inputu — tu zawsze czytasz ręcznie.

    Czego nie mówię

    Nie mówię, że vibe coding jest wadliwy ani że narzędzia AI są zawodne. Wszystkie trzy projekty, które zbudowałem, działają. Mają prawdziwych użytkowników. Rozwiązują prawdziwe problemy. Zysk produktywności jest realny — zbudowałem w rok to, co trzyosobowy zespół zrobiłby w osiemnaście miesięcy.

    Mówię, że tryby awarii są konkretne i nieoczywiste na starcie.

    Największe ryzyko w vibe codingu nie jest to, że AI pisze zły kod. Jest to, że AI pisze kod, który wygląda dobrze — aż coś idzie nie tak. I wtedy patrzysz na codebase, który na wpół rozumiesz, z bugiem, którego nie napisałeś, i modelem mentalnym mającym luki dokładnie w złych miejscach.

    Prędkość jest realna. Zbuduj nawyki, które sprawią, że będzie bezpieczna.

  • Vibe coding: co mówią badania naukowe, i porównanie narzędzi

    Vibe coding: co mówią badania naukowe, i porównanie narzędzi

    W lutym 2025 roku Andrej Karpathy — współzałożyciel OpenAI i były szef AI w Tesli — wrzucił post na X, który zmienił sposób, w jaki branża rozmawia o programowaniu. Napisał: „There’s a new kind of coding I call 'vibe coding’, where you fully give in to the vibes, embrace exponentials, and forget that the code even exists.”

    Do marca Merriam-Webster dodał termin do słownika jako „slang & trending”. W grudniu 2025 Collins Dictionary ogłosił vibe coding słowem roku. W tym samym roku pojawiło się kilkanaście recenzowanych prac naukowych próbujących odpowiedzieć na pytanie, które branża zadawała sobie od miesięcy: czy to naprawdę działa?

    Odpowiedź jest bardziej złożona niż większość nagłówków sugeruje.

    Definicja, którą warto uściślić

    Vibe coding to nie to samo co no-code. Nie chodzi też o kopiowanie odpowiedzi z ChatGPT. Badacze z ICSE 2026 definiują go jako iteracyjny cykl: sformułowanie celu w języku naturalnym → prompt → przegląd kodu → test → korekta. Człowiek jest product ownerem i architektem. AI — partnerem implementacyjnym.

    To zmienia wymagania względem dewelopera, ale ich nie eliminuje. Nie musisz wiedzieć, jak napisać hook React z optymistyczną aktualizacją UI. Musisz wiedzieć, że jej potrzebujesz i dlaczego.

    Co mówią badania — produktywność

    W 2025 roku ukazało się kilka istotnych prac. Zebrałem dane z najważniejszych.

    Kluczowe badania 2025

    101 źródeł z praktyki, 518 udokumentowanych przypadków użycia vibe codingu. Główne motywacje: szybsze prototypowanie, dostępność dla non-developerów, eksploracja pomysłów. Główne problemy: bezpieczeństwo, dług techniczny, brak rozumienia generowanego kodu.

    Kilka rzeczywistych aplikacji budowanych metodą vibe coding. Wynik: przyspieszenie prototypowania o 60–80%, wzrost kreatywności, ale konieczność nadzoru człowieka przy bezpieczeństwie i utrzymaniu kodu.

    Czas realizacji zadania: 2h41min → 1h11min (55% szybciej). Skuteczność: 70% → 78%. 87% deweloperów zgłosiło zachowanie flow przy złożonych zadaniach. 31% szybsze cykle feature development w teamach.

    Acceptance rate sugestii AI: 33%, akceptacja linii kodu: 20%. Developer satisfaction score: 72/100. Kluczowy wniosek: AI jest narzędziem do przyspieszania, nie zastępowania procesu myślowego.

    Nowe badania 2026

    16 doświadczonych deweloperów open-source, 246 zadań w dojrzałych projektach (średnio 5 lat doświadczenia z repozytorium). Wynik zaskakujący: AI wydłużyło czas realizacji o 19%. Przed zadaniami deweloperzy zakładali 24% przyspieszenie — mylili subiektywne odczucie z rzeczywistością. Kontekst: dotyczy złożonych, istniejących codebases, nie nowych projektów.

    Analiza ekonomiczna autorów z CEU Budapest i Kiel Institute. Vibe coding podnosi produktywność przez ułatwienie korzystania z open-source — ale jednocześnie eliminuje zaangażowanie użytkowników (bugi, dokumentacja, wsparcie maintainerów), z którego OSS czerpie utrzymanie. Wniosek: przy powszechnym vibe codingu obecne modele OSS nie są finansowo zrównoważone.

    Badanie preregistrowane, N=100 studentów. Wynik: umiejętności pisania i wiedza CS to najsilniejsze predyktory efektywności w vibe codingu — silniejsze niż ogólne zdolności poznawcze. Vibe coding nie niweluje bariery wiedzy — osoby z solidną bazą CS i umiejętnością precyzyjnego formułowania myśli korzystają z niego znacznie skuteczniej.

    Dane z systemów task management, IDE, statycznej analizy i CI/CD z 2 lat. Ponad 75% deweloperów używa AI coding assistants — ale organizacyjny wzrost produktywności wynosi zaledwie ~10%. Deweloperzy czują że są szybsi; firmowe metryki dostarczania oprogramowania tego nie potwierdzają.

    Czas realizacji zadania kodowania z AI i bez (minuty, GitHub Research 2024, n=95)

    Kontrolowane warunki, 95 profesjonalnych deweloperów. Redukcja czasu o 55% przy użyciu Copilot, ponad 67% przy zaawansowanych agentach.

    Co mówią badania — jakość kodu

    Tutaj dane są mniej wygodne dla entuzjastów vibe codingu.

    GitClear przeanalizował 211 milionów zmienionych linii kodu z lat 2020–2024 i wskazał na zjawisko, które nazywa AI-induced tech debt. Wyniki są niepokojące:

    Degradacja jakości kodu — wskaźniki GitClear 2025 (wartość „1” = poziom bazowy 2020/human-written)

    Źródło: GitClear AI Copilot Code Quality Research 2025, 211M linii kodu. CodeRabbit (470 PR, grudzień 2025): kod AI ma 1,7x więcej „major issues”.

    Niezależna analiza CodeRabbit z grudnia 2025 (470 pull requestów) potwierdziła: kod z udziałem AI zawiera 1,7x więcej poważnych błędów — głównie błędy logiczne, wadliwy control flow i błędne zależności.

    Paradoks vibe codingu: 55% szybciej, ale 2,74x więcej luk bezpieczeństwa. Obie liczby są prawdziwe jednocześnie.

    Refaktoryzacja kodu spadła z 25% zmienionych linii w 2021 do poniżej 10% w 2024. Duplikacja wzrosła 8-krotnie. Copy-paste code przewyższył moved code po raz pierwszy od dwóch dekad.

    Przypadek bezpieczeństwa — Lovable (maj 2025)

    170 z 1 645 aplikacji zbudowanych przez Lovable miało lukę, która umożliwiała dostęp do danych osobowych użytkowników bez uwierzytelnienia. Aplikacje były w produkcji. Żadna nie wysyłała ostrzeżenia o podatności.

    Porównanie narzędzi do vibe codingu

    Ekosystem rozwinął się błyskawicznie. Dwie kategorie: asystenci w IDE (Claude Code, Cursor, Windsurf, Codex) i app buildery (Lovable, Bolt, v0). Różnią się fundamentalnie grupą docelową i use case.

    Narzędzie Dla kogo Mocne strony Słabe strony $/mies.
    Claude Code Senior dev, złożone projekty Lider SWE-bench (79,6% Sonnet 4.6, 87,6% Opus 4.7). Najlepszy kontekst przy 40+ plikach naraz. Precyzyjny refactoring cross-file. Terminal-first — bez zbędnego GUI. Terminal only — brak GUI. Wolniejszy przy prostych, jednorazowych zadaniach. Wyższy koszt przy intensywnym użyciu. $20–200
    Cursor Deweloperzy, teams Pełny IDE (fork VS Code), 1M+ użytkowników. Do 8 równoległych agentów z auto-judge. .cursorrules dla kontekstu projektu. Największy ekosystem na rynku (360k płatnych klientów). Traci kontekst przy bardzo dużych refaktoryzacjach. Lock-in do własnego IDE — nie działa w JetBrains/Vim. $20
    Windsurf Deweloperzy, multi-IDE Cascade (persistentny kontekst agentowy, self-recovery). Wtyczki do 40+ IDE (JetBrains, Vim, XCode, NeoVim). Nr 1 LogRocket AI Dev Tool Rankings (luty 2026). Przejęty przez Cognition za $250M. Mniejszy ekosystem niż Cursor. Niepewność strategiczna po przejęciu przez Cognition (twórca Devin). $20
    Codex (OpenAI) Dev, enterprise GPT Open-source CLI. Wbudowane web search domyślnie. Wsparcie MCP servers. SWE-bench ~85% (GPT-5.3-Codex). Zoptymalizowany pod niskie opóźnienia. Wsparcie obrazów (screenshoty/wireframes). Młodsze narzędzie, mniejsza społeczność. Interfejs mniej dopracowany niż Cursor/Claude Code. Mniejsza kontrola nad środowiskiem. w planie ChatGPT
    Lovable Non-dev, MVP Najszybszy start — od opisu do działającej aplikacji w minuty. Świetny output UI/UX. Zero wiedzy technicznej wymagane. Idealny do walidacji pomysłu. Udokumentowane luki bezpieczeństwa (170/1645 aplikacji). Słaby przy zmieniających się wymaganiach. Nie nadaje się do złożonych systemów. $25–50
    Bolt.new Non-dev, prototyp StackBlitz w przeglądarce — zero instalacji. Szybki start. Dobre do demo i showcase. Traci spójność przy zmianach wymagań. Podobne ograniczenia jak Lovable — nie do produkcji bez audytu. $20
    v0 (Vercel) Designerzy, frontend Najlepszy do UI komponentów (React/Next.js/shadcn). Idealna integracja z Vercel. Precyzyjny w stylowaniu. Dobry dla designerów z minimalną wiedzą JS. Wąski zakres — frontend/UI only. Nie zastępuje pełnego asystenta kodowania. $20

    SWE-bench: jak mierzy się realne zdolności agentów

    SWE-bench Verified to benchmark oparty na prawdziwych bugach z GitHuba — nie syntetycznych zadaniach. Model dostaje repozytorium i issue, musi samodzielnie napisać patch, który przejdzie testy. Najbardziej wiarygodny pomiar zdolności agenta do realnego programowania.

    SWE-bench Verified — wyniki głównych modeli (kwiecień 2026, % rozwiązanych issues)

    Wzrost z 48,5% (GPT-4 Turbo, listopad 2023) do 87,6% (Claude Opus 4.7, kwiecień 2026) w niecałe 2,5 roku. Szybkość poprawy jest równie imponująca jak sam wynik.

    Które narzędzie wybrać — mapa decyzji

    🎯
    Duża baza kodu, głęboki refactoring, 40+ plików na raz?
    → Claude Code. Najlepsza retencja kontekstu, lider SWE-bench.

    Chcesz pełne IDE z AI, największy ekosystem, równoległe agenty?
    → Cursor. Lider rynku, 1M+ użytkowników, fork VS Code.

    🔧
    JetBrains, Vim, XCode — nie chcesz zmieniać edytora?
    → Windsurf. Jedyne narzędzie z wtyczkami do 40+ IDE.

    🌐
    Ekosystem OpenAI/GPT-5, zależy Ci na web search i MCP?
    → Codex CLI. Open-source, wbudowane web search, dobry przy zapytaniach wymagających aktualnych danych.

    🚀
    Non-developer, chcesz przetestować pomysł na aplikację w godzinę?
    → Lovable lub Bolt. Bez żadnej wiedzy technicznej. Pamiętaj o audycie bezpieczeństwa przed produkcją.

    Najlepsza strategia w 2026: Claude Code lub Codex do złożonych zadań agentowych; Cursor lub Windsurf do codziennego kodowania w IDE; Lovable / Bolt / v0 do szybkiego prototypowania bez wiedzy technicznej. Większość doświadczonych zespołów używa kilku narzędzi jednocześnie — zależnie od zadania.

    Vibe coding — co z tego wynika

    Karpathy, który ukuł termin, rok później przyznał publicznie, że do swojego nowego projektu napisał kod ręcznie — bo wymagał precyzji, której vibe coding nie dał. To dobra metafora dla całego zjawiska.

    Vibe coding nie zastępuje programowania. Radykalnie obniża próg wejścia — i tyle. Dane pokazują 55% wzrost prędkości przy 2,74x więcej lukach bezpieczeństwa. Obydwie liczby są prawdziwe jednocześnie. Pytanie nie brzmi „czy używać AI do pisania kodu” — to pytanie jest już za nami.

    Pytanie brzmi: kiedy wchodzi człowiek i bierze odpowiedzialność za to, co AI napisało? W prototypie — może nigdy. W systemie, który przetwarza dane użytkowników — zawsze, zanim kod trafi do produkcji.


    Źródła: Karpathy (X, luty 2025) · arxiv 2510.00328 / 2510.12399 (ICSE 2026) · IJSAT 2025 · GitHub/Microsoft Research 2024 (n=95) · GitClear 2025 (211M linii) · CodeRabbit (470 PR, grudzień 2025) · ZoomInfo Enterprise Study (styczeń 2025) · METR RCT arxiv 2507.09089 · arxiv 2601.15494 „Vibe Coding Kills OSS” · arxiv 2603.14133 · Faros AI (22K deweloperów) · SWE-bench (kwiecień 2026) · Collins Dictionary Word of the Year 2025

  • AI w rekrutacji: jak delegować zadania, nie myślenie

    AI w rekrutacji: jak delegować zadania, nie myślenie

    Ostatnio szukałem konkretnego sprzętu do kupienia. Zamiast najpierw przemyśleć czego tak naprawdę potrzebuję, otworzyłem ChatGPT i napisałem zapytanie. Dostałem odpowiedź. Podjąłem decyzję. Sprawną, szybką — ale cudzą.

    Zorientowałem się po fakcie, że nawet nie sformułowałem własnego zdania. AI wypełniło lukę zanim w ogóle zdążyła powstać.

    To niegroźne przy zakupie słuchawek. W rekrutacji — już niekoniecznie.

    Dlaczego w HR to ma większe znaczenie niż gdzie indziej

    W większości zawodów jeśli AI „pomyśli za Ciebie” — konsekwencją jest gorszy dokument, stracona godzina, poprawka w arkuszu. W HR konsekwencją jest człowiek, który nie dostał pracy na którą zasługiwał. Albo firma, która zatrudniła kogoś, kto na papierze pasował idealnie — i się nie sprawdził.

    AI w rekrutacji operuje na danych o ludziach. To jedyna dziedzina, gdzie błąd modelu ma twarz.

    Działy HR sięgają po AI coraz częściej i słusznie — narzędzia rzeczywiście odciążają od powtarzalnej pracy. Ale jest subtelna różnica między „AI przyspiesza moją pracę” a „AI myśli zamiast mnie”. I ta różnica w rekrutacji jest kluczowa.

    Gdzie AI w HR naprawdę pomaga

    Zanim przejdę do ostrzeżeń — fair use. Dane mówią wyraźnie, gdzie modele językowe robią robotę dobrze:

    Jak działy HR używają AI — regularne zastosowania (% respondentów, LinkedIn Talent Trends 2024)

    Widać wyraźnie: AI jest najchętniej używane do zadań administracyjnych — i właśnie tam daje największą wartość bez ryzyka.

    Wzorzec jest czytelny: AI jest najchętniej adoptowane do zadań powtarzalnych i administracyjnych. To też miejsca, gdzie błąd modelu jest łatwy do wychwycenia i poprawienia. Konkretne narzędzia do poszczególnych zadań:

    🎙️
    Granola
    Najlepszy do: notatek ze spotkań
    Transkrybuje i streszcza rozmowy w czasie rzeczywistym. Skupiasz się na kandydacie, nie na notatkach. Najlepsze narzędzie tego typu.

    🌐
    ChatGPT
    Najlepszy do: researchu online
    Dostęp do internetu w czasie rzeczywistym. Sprawdza firmy, zbiera kontekst branżowy, szkicuje ogłoszenia i szablony dokumentów.

    📄
    Claude
    Najlepszy do: długich dokumentów
    Analiza dłuższych CV, briefów, raportów. Duże okno kontekstowe — czyta cały plik naraz. Precyzyjny przy złożonych zapytaniach.

    🇵🇱
    Bielik
    Najlepszy do: wrażliwych danych
    Polski model open-source. Dane kandydatów przetwarzane lokalnie — bez wysyłania do zewnętrznych serwerów. Dobry dla RODO.

    Wspólny mianownik: AI pomaga tam, gdzie zadanie jest powtarzalne, ustrukturyzowane i nie wymaga oceny człowieka jako człowieka.

    Gdzie zaczyna się problem

    Problem pojawia się, gdy AI wkracza w obszary wymagające ludzkiego osądu — i robi to niepostrzeżenie.

    Sygnały ostrzegawcze — kiedy AI zaczyna myśleć za Ciebie

    Pytasz AI o opinię zanim wyrobisz własną
    „Oceń tego kandydata na podstawie CV” — zanim sam przejrzałeś dokument.

    Pytania rekrutacyjne generujesz w całości z AI
    Rozmowa jest technicznie poprawna, ale generyczna — nie wydobywa tego co ważne dla Twojego zespołu.

    AI podsumowuje rozmowę — i to staje się Twoim wspomnieniem kandydata
    Streszczenie jest dokładne, ale wycinasz z procesu własną intuicję i emocjonalny odbiór rozmowy.

    Decyzja „tak/nie” jest de facto decyzją modelu
    Skoring AI wyrzucił kandydata z procesu — i nikt nie sprawdził dlaczego.

    Framework: najpierw Ty, potem AI

    Zasada, którą stosuję w swojej pracy i którą proponuję działom HR:

    1

    Zanim zapytasz AI — 2 minuty własnej myśli
    Przejrzyj CV. Posłuchaj nagrania. Przeczytaj cover letter. Zrób mentalną notatkę. Dopiero potem użyj AI do weryfikacji lub rozwinięcia. To jedyna zasada, która wymaga dyscypliny — reszta jest łatwa.

    2

    AI przyspiesza, nie startuje
    Użyj modelu do usprawnienia czegoś, co już przemyślałeś — nie do wypełnienia luki zanim myśl powstała. Różnica jest subtelna, ale konsekwencje są zupełnie inne.

    3

    Każda decyzja o człowieku ma być Twoja
    AI może rekomendować, rankingować, sugerować. Ale „zatrudniamy” i „nie zatrudniamy” to zdania, za którymi stoi człowiek — nie model. To nie jest retoryka. To jest odpowiedzialność.

    AI jest jak dobry asystent — nie jak dobry rekruter

    Dobry asystent odciąży Cię od papierkologii, przyśpieszy research, przygotuje szkice. Ale nie zastąpi Twojej oceny człowieka. Nie wyczuje napięcia w głosie kandydata. Nie zauważy, że ktoś jest świetny mimo niedoskonałego CV. Nie poczuje, że mimo idealnych kompetencji — ktoś nie pasuje do kultury Waszego zespołu.

    Te rzeczy są nieprzenoszalne. I właśnie dlatego są Twoją przewagą — niezależnie od tego ile modeli pojawi się na rynku.


    Narzędzia wymienione w artykule: Granola (granola.so) | ChatGPT (openai.com) | Claude (claude.ai) | Bielik (speakleash.org) | Dane: LinkedIn Talent Trends 2024

  • Jak uczyć AI ludzi, którzy nie są programistami — wnioski z wdrożeń

    Jak uczyć AI ludzi, którzy nie są programistami — wnioski z wdrożeń

    2018 rok. Stoimy z grupą operatorów w hali odlewni Krakodlew. Za chwilę zakładają gogle VR i pierwsze raz w życiu wchodzą do wirtualnego środowiska pracy. Jeden z nich — 20 lat przy piecu, doświadczony — mówi do mnie: „To dla młodych. Ja swoje wiem.”

    Dwie godziny później ten sam człowiek pyta, kiedy jest następna sesja.

    Nauczanie technologii — szczególnie AI i narzędzi opartych na AI — ma ten sam wzorzec. Bariera wejścia jest psychologiczna, nie techniczna. I kiedy ją pokonasz właściwą metodą, reszta przychodzi zaskakująco szybko.

    W ciągu ostatnich kilku lat pracowałem z ludźmi, którzy nigdy nie napisali linii kodu: operatorami maszyn, menedżerami produkcji, kadrą zarządzającą, studentami szkół zawodowych. Oto co faktycznie działa.

    Błąd nr 1: zacznij od technologii

    Większość kursów i warsztatów AI zaczyna tak: „Dziś poznasz modele językowe. LLM to model trenowany na dużych zbiorach danych…”

    Tracisz ucznia w czwartym zdaniu.

    Dorośli uczą się inaczej niż dzieci. Nie przyswajają abstrakcji a potem szukają zastosowania — przyswajają konkret i potem szukają teorii, która go wyjaśnia. Andragogika (pedagogika dorosłych) mówi to od lat sześćdziesiątych. Problem w tym, że większość instruktorów AI to inżynierowie, którzy uczą tak, jak sami się uczyli.

    Zasada: zacznij od problemu, który uczestnik ma dziś. Nie od technologii, którą chcesz mu pokazać.

    W odlewni nie zaczęliśmy od „jak działa VR”. Zaczęliśmy od: „Pokażę ci sytuację, w której doszło do wypadku w podobnym zakładzie. Jak byś zareagował?” Technologia stała się narzędziem do rozwiązania konkretnego, realnego problemu. Nie demonstracją.

    Framework, który działa: „Dotknij, potem wyjaśnij”

    W szkoleniach VR wypracowałem sekwencję, którą nazywam „dotknij, potem wyjaśnij”. Działa tak samo w nauce AI i vibe codingu:

    • 1. Zrób to razem — nie wyjaśniaj najpierw. Daj uczestnikowi proste zadanie do wykonania od razu. Błąd w bezpiecznym środowisku to więcej niż godzina wykładu.
    • 2. Nazwijcie to wspólnie — kiedy coś zadziała (lub nie), zapytaj: „Co się stało? Dlaczego, jak myślisz?” Uczeń buduje model mentalny z własnego doświadczenia.
    • 3. Teraz wyjaśnij mechanizm — dopiero po tym pojęcia takie jak „token”, „kontekst”, „temperatura” mają znaczenie. Bo masz konkretną sytuację, do której można je przykleić.
    • 4. Daj im problem do rozwiązania samodzielnie — nie „ćwiczenie z instrukcją”. Problem, którego nie rozwiązywałeś z nimi wcześniej.
    ~40%

    krótszy czas onboardingu po VR vs. tradycyjne szkolenie (Krakodlew, 2018)
    0

    incydentów spowodowanych luką proceduralną w pierwszych 6 mies. pracy (ta sama kohorta)

    szybsze przyswajanie wiedzy w środowisku immersyjnym vs. sala (PwC 2020, n=10 000)

    Te liczby dotyczą VR, ale wzorzec jest ten sam: kiedy uczysz przez działanie, a nie przez słuchanie, wyniki są drastycznie inne.

    Co blokuje uczenie się AI — i jak to usunąć

    Nauczając AI i vibe coding, napotkasz kilka stałych barier:

    „To nie dla mnie, jestem za stary / za mało techniczny”

    Antidotum: pokaż konkretny przykład osoby podobnej do ucznia, która to robi. Nie Elona Muska. Kogoś, kto prowadzi mały biznes i używa Claude do pisania ofert. Kogoś, kto jest operatorem i nauczył się programować robota na kursie. Identyfikacja przed aspiracją.

    „Nie wiem, co powiedzieć do AI”

    Antidotum: daj szablony. Nie jako sztywne formularze, ale jako punkty startowe. „Jestem [rola], próbuję [cel], mam problem z [konkret].” Uczniowie potrzebują rusztowania, zanim zbudują własny styl promptowania.

    „Skąd wiem, że odpowiedź jest poprawna?”

    To najlepsza bariera, bo jest uzasadniona. Krytyczne myślenie wobec outputu AI to kluczowa umiejętność — nie przeszkoda w nauce. Naucz ucznia weryfikować: cross-check z innym źródłem, test „czy to ma sens w moim kontekście”, pytanie zwrotne do AI („sprawdź czy nie popełniłeś błędu w założeniu X”).

    Najlepsi uczniowie AI to nie ci, którzy ufają mu bezwarunkowo — to ci, którzy umieją prowadzić dialog: pytają, weryfikują, poprawiają, iterują.

    Robotyka jako wejście do AI dla młodszych uczniów

    W XR FabLab w Chrzanowie pracowaliśmy z uczniami szkół zawodowych. Próg wejścia do abstrakcyjnego „AI” był za wysoki. Robotyka okazała się idealnym pomostem.

    Dlaczego robotyka działa:

    • Natychmiastowa pętla zwrotna — robot jedzie lub nie. Nie ma dwuznaczności. Uczeń widzi efekt swojej decyzji w ciągu sekund, nie dni.
    • Fizyczny artefakt — można go dotknąć, pokazać rodzicom, zepsuć i naprawić. Kod na ekranie jest abstrakcyjny. Robot jest rzeczywisty.
    • Programowanie jako rozkazy — uczniowie instynktownie rozumieją sekwencję rozkazów. To prosta analogia do promptowania AI.
    • Element rywalizacji — wyścigi, wyzwania, rankingi. Motywacja zewnętrzna, dopóki nie pojawi się wewnętrzna.

    Kiedy uczeń rozumie, że robot wykonuje dokładnie to, co mu powiedział (i nie więcej, i nie mniej), rozumie też, dlaczego precyzja w promptowaniu ma znaczenie. To jest moment transferu.

    Co różni dobrego instruktora AI od złego

    Dobry instruktor AI nie jest tym, który zna API dokumentację na pamięć. Jest tym, który:

    • Pamięta, jak to było nie wiedzieć — i potrafi wyobrazić sobie perspektywę ucznia
    • Cieszy się, kiedy uczeń go zaskoczy nowym zastosowaniem narzędzia
    • Traktuje błąd ucznia jako informację diagnostyczną, nie porażkę
    • Sam nadal się uczy — AI zmienia się co kilka miesięcy, kto stoi w miejscu, zostaje w tyle

    Najważniejsze zdanie, które możesz powiedzieć uczniowi: „Nie wiem, sprawdźmy razem.” To modeluje dokładnie ten rodzaj myślenia, który AI wymaga.

    Praktyczny punkt startowy

    Jeśli projektujesz kurs lub warsztat AI od zera, jeden schemat który polecam:

    • Sesja 1: Problem uczestnika → pierwsze zetknięcie z narzędziem → zaskoczenie (dobre lub złe) → wspólna analiza
    • Sesja 2: Budowanie słownika → szablony promptów → pierwsze samodzielne zadanie
    • Sesja 3+: Projekt własny uczestnika → iteracja → prezentacja wyniku

    Projekt własny jest kluczowy. Kiedy uczestnik rozwiązuje swój problem (nie ćwiczenie z instrukcją), a AI mu w tym pomaga — w tym momencie narzędzie staje się jego.

    Kogo w twojej organizacji lub klasie jest najtrudniej przekonać do AI — i co jest ich główną barierą?


    Autor wdrażał szkolenia VR w środowiskach przemysłowych od 2018 r. (Krakodlew, XR FabLab Chrzanów). Uczy AI, automatyzacji i kodowania wspomaganego AI w kontekście praktycznym — w Polsce i za granicą. Źródła: PwC VR Soft Skills Study 2020 (n=10 000); dane własne Krakodlew/Industrverse 2018–2024.

  • Vibe Coding: jak zbudowałem 3 aplikacje bez zespołu developerów

    Vibe Coding: jak zbudowałem 3 aplikacje bez zespołu developerów

    W 2023 roku postanowiłem zbudować platformę dla inwestorów budowlanych. Listy kontrolne zakupu działki, śledzenie budżetu, dokumenty, eksperci, mapy w jednym miejscu. Aplikacja mobilna na iOS i Android, plus wersja web.

    Nie miałem ani jednego developera w zespole.

    Nie szukałem też freelancera. Zamiast tego wziąłem laptop, otworzyłem Claude Code i zacząłem pisać prompty.

    Dziś naswoim.org działa. Użytkownicy zalogowani. Dane w Supabase. Wersja mobilna w App Store i Google Play. I przez cały czas budowałem ją równolegle z dwoma innymi projektami.

    Czym jest vibe coding?

    Vibe coding to nie to samo co no-code. Nadal piszesz kod. Ale nie piszesz go sam od zera — piszesz go razem z modelem AI, który generuje implementację na podstawie twojej specyfikacji.

    Nie chodzi też o wklejanie pytań do ChatGPT i kopiowanie odpowiedzi. Chodzi o precyzyjne myślenie o problemie i opisywanie go w sposób, który AI może przetworzyć na działający kod.

    Definicja robocza: Vibe coding to model pracy, w którym człowiek jest product ownerem i architektem, a AI jest partnerem implementacyjnym. Ty decydujesz co i dlaczego. AI decyduje jak.

    To zmienia wymagania. Nie musisz wiedzieć, jak napisać hook React z optymistyczną aktualizacją UI. Musisz wiedzieć, że jej potrzebujesz i dlaczego.

    Trzy produkty, zero zewnętrznych developerów

    3

    aplikacje zbudowane w modelu vibe coding
    0

    zewnętrznych developerów zatrudnionych
    4

    platformy: web, iOS, Android i SaaS B2B

    marcinpaszkiewicz.com — ta strona. Astro SSR, WordPress Headless jako CMS, deploy na Vercel. Każda zmiana — nowy artykuł, poprawka layoutu, nowa funkcja — powstaje przez Claude Code. Czas od pomysłu do działającej zmiany: zwykle poniżej godziny.

    naswoim.org — pełny stack: React 19 + Vite, Tailwind CSS, Supabase (PostgreSQL + Auth + Storage + Realtime), Capacitor na iOS i Android. Dwadzieścia stron, kilkanaście hooków domenowych, dwadzieścia kilka komponentów feature. System uprawnień (RLS), 20 migracji SQL, integracja z mapami Leaflet. Wszystko zbudowane bez rekrutacji.

    industrverse.com — najtrudniejszy technicznie. Frontend: Next.js + React 19. Backend: NestJS z 13 modułami, Prisma + PostgreSQL, Redis, JWT/Passport, Socket.io (WebSockets do sesji VR w czasie rzeczywistym), Swagger, integracje Google API. Docker Compose z czterema serwisami. Monorepo npm. Siedem ról użytkownika. Dziewięć dashboardów zależnych od roli.

    Żaden z tych projektów nie byłby możliwy w rozsądnym czasie i budżecie bez AI jako partnera programistycznego. Z AI — każdy z nich stał się wykonywalny dla jednej osoby.

    Jak wygląda mój workflow

    Nie ma jednego narzędzia. Używam kilku, zależnie od zadania:

    • Claude Code (CLI) — do głębokiej pracy z plikami: nowe funkcje, refaktoring, debugowanie w kontekście całego projektu. Rozumie strukturę repozytorium, czyta wiele plików naraz, proponuje zmiany z dokładnością do linii.
    • Claude.ai — do planowania architektury, omawiania decyzji projektowych, szybkich pytań na etapie design. Tutaj rozmawiamy o tym, co budujemy, zanim zacznę go kodować.
    • GitHub Copilot — do autouzupełniania w edytorze, szczególnie przy powtarzalnych fragmentach (komponenty, testy, migracje SQL).

    Iteracja wygląda tak: definiuję zadanie precyzyjnie → AI generuje szkielet → przeglądam i prowadzę → AI poprawia → testuję → powtarzam. Kluczowe jest „prowadzę” — to nie jest automat. Ty jesteś kierowcą.

    Co AI robi dobrze

    • Scaffolding i boilerplate — nowy endpoint API, nowy komponent, nowa migracja SQL. AI wie, jak to wygląda, i generuje to szybko i poprawnie.
    • Debugowanie z kontekstem — wklej błąd + relevantny kod → AI diagnozuje. Zwykle trafnie. To oszczędza godziny poszukiwań na Stack Overflow.
    • Refaktoring — zmiana nazwy, restrukturyzacja, dodanie typów TypeScript do istniejącego kodu JavaScript. AI jest w tym bezbłędne i szybkie.
    • Tłumaczenie między warstwami — „mam tę logikę w backendzie, napisz odpowiadający hook na frontendzie”. AI rozumie obie strony.

    Gdzie nadal potrzebny jest człowiek

    Vibe coding nie eliminuje potrzeby myślenia. Zmienia tylko to, o czym myślisz.

    • Decyzje architektoniczne — jak podzielić system, gdzie umieścić logikę, jakie kompromisy przyjąć. AI proponuje, ale decydujesz ty.
    • UX i product design — co powinien czuć użytkownik w danym momencie. AI nie zna twoich użytkowników.
    • Bezpieczeństwo — każdy kod dotyczący auth, danych wrażliwych, uprawnień wymaga twojej weryfikacji. AI popełnia błędy w RLS, w walidacji wejścia, w ekspozycji API.
    • Złożony stan w dużej bazie kodu — przy projekcie powyżej pewnego rozmiaru AI traci kontekst. Musisz go prowadzić precyzyjnie.

    Vibe coding nie zastępuje zrozumienia kodu — przesuwa granicę tego, co możliwe bez wieloletniego doświadczenia programistycznego. To nie magia. To leverage.

    Czego nauczyłem się po drodze

    Największa pułapka: traktowanie AI jak automat do kodu. Wklejasz opis, otrzymujesz kod, wklejasz do projektu bez czytania. To kończy się błędami bezpieczeństwa, niespójnym stylem i długiem technicznym, który zrozumiesz dopiero za sześć miesięcy.

    Druga pułapka: zbyt ogólne prompty. „Napisz mi aplikację do zarządzania budżetem” daje wynik generyczny i bezużyteczny. „Napisz hook useProjectBudget, który subskrybuje się do tabeli expenses w Supabase przez Realtime, agreguje sumy per category i zwraca isLoading, error, totals oraz addExpense” — daje dokładnie to, czego potrzebujesz.

    Vibe coding nie wymaga znajomości każdej linijki kodu. Wymaga precyzyjnego myślenia o problemie — i to jest umiejętność, którą można rozwinąć celowo.

    Od czego zacząć

    Jeśli chcesz zacząć budować w modelu vibe coding, trzy rzeczy dają największy zwrot:

    • Podstawy Git — commit, push, branch, merge. Bez tego nie możesz bezpiecznie eksperymentować. Git to twoja siatka bezpieczeństwa.
    • Umiejętność czytania błędów — nie musisz rozumieć każdej linii kodu, ale musisz umieć przeczytać komunikat błędu i wkleić go do AI z kontekstem. To 80% debugowania.
    • Podstawy SQL — większość aplikacji ma bazę danych. Rozumienie SELECT, INSERT, JOIN i podstaw schematu pozwala ci prowadzić AI przez warstwy danych.

    Następny krok: wybierz narzędzie. Claude Code, Cursor, GitHub Copilot — każde ma swoje mocne strony. Zacznij od jednego, na małym projekcie. Nie od razu od aplikacji z bazą danych.

    Jaki problem chciałbyś rozwiązać swoim pierwszym vibe coding projektem?


    Autor buduje w modelu vibe coding od 2023 r. Stack naswoim.org: React 19, Supabase, Capacitor. Stack industrverse.com: NestJS, Next.js, PostgreSQL, Redis, Docker. Stack tej strony: Astro SSR, WordPress Headless, Vercel.

  • Szkolenia VR vs. e-learning w przemyśle: co mówią dane i kiedy warto wybrać VR

    Szkolenia VR vs. e-learning w przemyśle: co mówią dane i kiedy warto wybrać VR

    Symulator wirtualnej odlewni — środowisko VR szkoleń Krakodlew
    Krakodlew, Kraków — operator podczas szkolenia VR w wirtualnym odlewie. Błędy zdarzają się tutaj, nie przy piecu.

    2018 rok. Stoję przed zarządem jednej z największych polskich odlewni i tłumaczę, dlaczego wdrożenie szkoleń VR ma sens. Na sali siedzą ludzie, którzy szkolili pracowników przez 30 lat metodą „mistrz–uczeń” — i przez 30 lat to działało.

    Pytanie, które padło, było przewidywalne: „Po co płacić za wirtualną rzeczywistość, skoro mamy e-learning?”

    To dobre pytanie. Ale źle postawione.

    Bo problem nie leży w koszcie technologii — leży w tym, do czego jej używasz.

    Co mówią dane — PwC 2020

    W 2020 roku PwC opublikowało jedno z największych badań porównawczych szkoleń VR w środowisku korporacyjnym. 10 000 uczestników. Trzy metody: szkolenie w sali, e-learning, VR. Wyniki były jednoznaczne.

    Szybkość przyswajania wiedzy — indeks względem szkolenia w sali (PwC 2020, n=10 000)

    Uczestnicy VR ukończyli szkolenia 4× szybciej niż w sali i 2.7× szybciej niż przez e-learning. Źródło: PwC, 2020 VR Soft Skills Study

    Cztery razy szybciej to nie margines statystyczny. To różnica między szkoleniem trwającym tydzień a szkoleniem trwającym dwa dni.

    Pewność w zastosowaniu zdobytych umiejętności — wzrost vs. szkolenie w sali (PwC 2020)

    Uczestnicy VR wykazywali 275% wyższy poziom pewności w stosowaniu wiedzy niż po szkoleniu w sali. Źródło: PwC, 2020 VR Soft Skills Study

    Różnica między „wiem jak to zrobić” a „czuję, że potrafię to zrobić” — to właśnie ta 275%. I w środowisku przemysłowym ta różnica ma bezpośrednie przełożenie na wypadki, błędy i jakość.

    Widok z symulatora VR — wirtualna odlewnia
    Widok z symulatora — operator w wirtualnej odlewni. Każdy błąd jest informacją zwrotną, nie wypadkiem.

    Kiedy VR wygrywa z e-learningiem

    E-learning sprawdza się tam, gdzie chodzi o przekazanie informacji: procedury BHP, regulacje, wiedza produktowa. Można go zrobić tanio, szybko zaktualizować i uruchomić na każdym laptopie.

    VR wygrywa, gdy chodzi o zbudowanie odruchu i pewności w sytuacjach, których nie możesz bezpiecznie powtarzać w rzeczywistości.

    szybsze przyswajanie wiedzy niż w sali szkoleniowej
    275%

    wyższa pewność stosowania umiejętności vs. szkolenie w sali
    3.75×

    wyższe zaangażowanie emocjonalne niż przy klasycznym szkoleniu

    W odlewni scenariusze, które ćwiczyliśmy w VR, to sytuacje awaryjne przy piecu topielniczym — przegrzanie, wyciek metalu, nieprawidłowe odczyty temperatury. Żadnego z tych scenariuszy nie da się przećwiczyć „na żywo” bez ryzyka poważnego wypadku.

    VR nie zastępuje e-learningu. Rozwiązuje inny problem — tam, gdzie sama wiedza nie wystarczy i potrzebna jest reakcja ciała.

    Ekonomia: kiedy VR przestaje być drogi

    Główna obiekcja zarządów brzmi zawsze tak samo: „To jest drogie”. I to prawda — koszt tworzenia treści VR jest wyższy niż e-learningu. Ale to jest koszt jednostkowy tworzenia, nie koszt jednostkowy szkolenia.

    Koszt szkolenia na uczestnika — e-learning vs. VR w zależności od skali (model szacunkowy)

    Koszt VR na uczestnika spada wraz ze skalą — przy 500+ osobach jest porównywalny z e-learningiem, przy jednoczesnie wyższej skuteczności. Model szacunkowy na podstawie danych rynkowych 2024.

    Do tego dochodzą koszty, których e-learning nie eliminuje: zatrzymanie linii produkcyjnej na czas szkolenia, dojazdy, sala, instruktor. VR można przeprowadzić przy stanowisku, w 20 minut, bez zatrzymywania produkcji.

    Symulator VR — procedury bezpieczeństwa w odlewni
    Symulator procedur bezpieczeństwa — operator ćwiczy reakcję na sytuację awaryjną bez zatrzymywania produkcji.

    Kiedy e-learning jest lepszym wyborem

    VR nie jest odpowiedzią na wszystko. Są sytuacje, gdzie e-learning jest obiektywnie lepszym wyborem:

    • Szybkie aktualizacje treści — zmiana regulacji, nowy produkt, aktualizacja procedury. E-learning można zmienić w dzień. Treść VR wymaga rekonstrukcji 3D.
    • Szkolenia czysto informacyjne — compliance, prawo pracy, onboarding ogólny. Nie potrzebujesz immersji żeby zapamiętać numer telefonu alarmowego.
    • Mała skala jednorazowa — jeśli szkolisz 5 osób raz w roku, koszt produkcji treści VR nie zwróci się.
    • Dostęp z każdego urządzenia — e-learning działa na telefonie w domu. VR wymaga sprzętu.

    Pytanie nie brzmi „VR czy e-learning” — lecz „który proces wymaga której metody”.

    Z praktyki: szkolenia VR w odlewni

    W Krakodlew wdrożyliśmy szkolenia VR dla procedur bezpieczeństwa przy piecach topielniczych. Wynik: skrócenie czasu wdrożenia nowych operatorów o ok. 40%, zero incydentów wynikających z nieznajomości procedur w pierwszych 6 miesiącach pracy. Wzorzec, który później zastosowałem w kolejnych wdrożeniach dla przemysłu.

    Praktyczna zasada decyzyjna

    Zanim zdecydujesz o metodzie szkolenia, odpowiedz na trzy pytania:

    • Czy błąd podczas szkolenia może być niebezpieczny lub bardzo kosztowny w rzeczywistości? → VR
    • Czy szkolenie dotyczy fizycznych czynności i procedur, a nie samej wiedzy? → VR
    • Czy będziesz szkolić tę samą treść dla 50+ osób przez kilka lat? → VR jest opłacalny

    Jeśli odpowiedź na wszystkie trzy to „nie” — e-learning jest mądrzejszym wyborem.

    Jakie szkolenia w Twojej organizacji byłyby najlepszym kandydatem do VR?


    Źródła: PwC — VR Soft Skills Study 2020 (n=10 000) | Brandon Hall Group — Learning & Development Research | Dane własne: wdrożenia Krakodlew 2018–2024

  • Analiza potencjału robotyzacji w odlewni: dlaczego właściwy priorytet rzadko jest oczywisty

    Analiza potencjału robotyzacji w odlewni: dlaczego właściwy priorytet rzadko jest oczywisty

    Hala odlewnicza Krakodlew
    Hala odlewnicza Krakodlew, Kraków — jedno z miejsc, gdzie zaczęła się ta historia.

    2018 rok. Jestem w jednej z największych polskich odlewni. Zamiast szukać „oczywistego” kandydata do robotyzacji, zaczynam od stworzenia digital twin hali produkcyjnej — modelu odwzorowującego poszczególne odcinki procesu, który pozwala oceniać potencjał automatyzacji bez zatrzymywania linii.

    Każdy odcinek opisuję przez zestaw parametrów: częstotliwość operacji, poziom zagrożeń BHP, podatność procesu na automatyzację, szacowany ROI. Dane zbieramy przy każdym stanowisku. Dopiero po tej analizie formułuję rekomendację.

    Schemat koncepcyjny — digital twin hali: analiza odcinków wg poziomu hazardu

    Strefa A
    Oczyszczanie odlewów
    ⚠ hazard: KRYTYCZNY

    Strefa B
    Piece topielnicze
    ⚠ hazard: WYSOKI

    Strefa C
    Kontrola jakości
    hazard: NISKI

    Strefa D
    Paletyzacja
    hazard: NISKI

    Model koncepcyjny — rzeczywisty digital twin obejmował kilkanaście odcinków produkcji z pełną parametryzacją procesów.

    Pytanie, które postawił zarząd: gdzie inwestujemy jako pierwsze?

    Właściwe pytanie zmienia wszystko

    Nie pytam „co jest najtańsze do zautomatyzowania”. Pytam: „gdzie człowiek jest najbardziej zagrożony?”

    To nie sentimentalizm — to racjonalna ekonomia. Procesy z najwyższym poziomem hazardu mają też inne charakterystyki: wysoka rotacja pracowników, absencja chorobowa, koszty medyczne, ryzyko wypadków ze skutkami prawnymi. BHP i rachunek ekonomiczny wskazują tu w tym samym kierunku.

    Kryteria analizy, w kolejności od najważniejszego:

    • Zagrożenia dla życia i zdrowia (BHP) — czy automatyzacja eliminuje czynniki szkodliwe: temperaturę, hałas, pył, drgania, ryzyko wypadku? To kryterium nadrzędne.
    • Powtarzalność procesu — czy robot może wykonywać to zadanie identycznie, za każdym razem, bez wyjątków?
    • Czas zwrotu (ROI) — kiedy inwestycja się zwróci i jakie są ryzyka?
    • Dojrzałość techniczna — czy technologia jest wystarczająco stabilna na środowisko produkcyjne?
    • Odporność linii — co się dzieje z produkcją, gdy robot stanie nieoczekiwanie?

    Wynik oceny kandydatów — analiza potencjału robotyzacji (0–10, kryterium główne: BHP)

    Wyższy wynik = wyższy priorytet robotyzacji. Kryterium nadrzędne: poziom zagrożeń BHP i wpływ na zdrowie operatorów.

    Rekomendacja #1: oczyszczanie odlewów wielkogabarytowych

    To najbardziej fizycznie wyniszczająca praca na hali — szlifowanie, ciężkie dźwiganie, wysoka temperatura, hałas, pył, drgania. Operator narażony jest jednocześnie na wszystkie główne czynniki szkodliwe. Żaden inny analizowany proces nie wykazywał takiej kumulacji hazardów.

    Czynniki szkodliwe — oczyszczanie odlewów wielkogabarytowych

    Temperatura

    ekstremalna
    Hałas

    >100 dB
    Pył metaliczny

    wysoki
    Drgania

    ciągłe
    Obciążenie

    ciężkie

    To nie tylko kwestia etyki. Oczyszczanie odlewów wielkogabarytowych ma też cechy sprzyjające automatyzacji — wysoka powtarzalność geometrii dużych odlewów, brak złożonej decyzyjności, mierzalny efekt (jakość powierzchni). Ochrona człowieka i rachunek ekonomiczny wskazują tu w tym samym kierunku.

    Rekomendacja #2: pomiar temperatury w piecu odlewniczym

    Wnętrze odlewni — piece topielnicze
    Piece topielnicze w odlewni — obszar, gdzie dokładność pomiaru temperatury ma bezpośredni wpływ na jakość odlewów i bezpieczeństwo procesu.

    Drugi priorytet — i równie nieprzypadkowy. Praca operatora przy pomiarze temperatury w piecu wiąże się z bezpośrednim narażeniem na promieniowanie cieplne i ryzykiem ekstremalnych zdarzeń termicznych. Dodatkowy argument: błędny pomiar to wadliwy odlew — bezpośrednia strata finansowa i ryzyko jakościowe dla klienta. Wysoka powtarzalność, zerowa tolerancja błędu, klarowny ROI.

    Analiza potencjału robotyzacji to nie lista życzeniowa dotycząca tego, co jest najtańsze do wdrożenia. To uszeregowany argument o tym, gdzie technologia tworzy największą wartość — dla człowieka i dla procesu jednocześnie.

    Polska kontra świat: skala wyzwania

    Dane Międzynarodowej Federacji Robotyki (IFR 2024) pokazują, gdzie jesteśmy:

    Gęstość robotyzacji — liczba robotów na 10 000 pracowników w produkcji (IFR 2024)

    Źródło: International Federation of Robotics — World Robotics 2024

    Polska ma 81 robotów na 10 000 pracowników — to prawie 3× poniżej średniej UE i 5× poniżej Niemiec (429/10 000). Jesteśmy największym rynkiem robotyki w Europie Środkowo-Wschodniej, ale przepaść jest ogromna. I właśnie dlatego jakość decyzji o automatyzacji jest tu szczególnie ważna — bo pieniędzy na błędy nie ma.

    Przestroga: kiedy „oczywisty wybór” kosztuje miliardy

    Targi GIFA 2019 w Düsseldorfie — przemysł odlewniczy
    Targi GIFA 2019 w Düsseldorfie — największe targi przemysłu odlewniczego na świecie. Tutaj prezentowaliśmy nasze pierwsze wdrożenie VR dla przemysłu.

    Historia Tesli z lat 2017–2018 to podręcznikowy przykład błędu, który zdarza się w każdej branży. Tesla zainstalowała setki robotów przemysłowych, żeby produkować 5 000 samochodów tygodniowo. Efekt? Nie mogła wyprodukować nawet 2 500.

    Elon Musk przyznał publicznie: „Nadmierna automatyzacja była błędem. Ludzie są niedoceniani.”

    2 500

    aut/tydzień zamiast planowanych 5 000 — mimo pełnej automatyzacji
    1–3 lata

    typowy czas zwrotu — prostsze aplikacje (coboty, paletyzacja) poniżej roku
    6–36 mies.

    czas zwrotu zależy od projektu: proste coboty poniżej roku, złożone systemy 2–3 lata

    Roboty wykonują powtarzalne czynności w stabilnym środowisku — i robią to doskonale. Ludzie pozostają niezastąpieni tam, gdzie wymagana jest elastyczność i decyzja w sytuacji wyjątkowej. Optymalne są rozwiązania hybrydowe — nie pełna automatyzacja.

    Co faktycznie się automatyzuje

    Najczęściej automatyzowane procesy w produkcji (% firm wg Windward Studios 2024)

    Operator podczas szkolenia VR
    Operator podczas szkolenia VR w Krakodlew — technologia wspierająca człowieka, nie zastępująca go.

    Globalne statystyki pokazują dominację paletyzacji i obsługi materiałów — procesów z jasnym ROI i niskim hazardem. W środowisku odlewniczym, gdzie kumulacja czynników szkodliwych jest wyjątkowo wysoka, analiza zaczyna się od innego miejsca.

    Wniosek: analiza potencjału, nie lista życzeń

    Po tej analizie w 2018 roku wróciłem do zarządu z rekomendacją, która zaskoczyła wielu. Spodziewali się wskazania tańszego, szybszego w implementacji celu. Argument był prosty: jeśli nie możemy uzasadnić priorytetyzacji robotyzacji tam, gdzie stawką jest zdrowie i życie operatora, nie możemy jej uzasadnić nigdzie.

    Analiza potencjału robotyzacji nie jest dokumentem politycznym. Jest rankingiem, w którym ochrona człowieka i tworzenie trwałej wartości procesowej idą w parze — bo tylko takie projekty mają sens długoterminowo.

    Czy widziałeś kiedyś w swoim zakładzie proces, który „wszyscy wiedzieli, że trzeba zautomatyzować” — ale nikt nie liczył prawdziwych kosztów jego braku automatyzacji dla ludzi?


    Źródła: IFR — World Robotics 2024 (ifr.org) | B. Büchel, D. Floreano, IMD Case Study: Tesla 2018 | S. Gibbs, The Guardian, 16.04.2018 | AutomatykaOnline.pl — ROI automatyzacji | pro-assem.pl — zastosowania robotów przemysłowych | CentrumMaszynCNC.pl — kryteria wyboru procesów | Zdjęcia: archiwum własne, Krakodlew / GIFA 2019