Wyobraźcie sobie zaawansowaną sztuczną inteligencję, która generuje unikalne, stylizowane światy bez wysyłania nawet jednego bajta danych na zewnętrzne serwery. A wszystko dzieje się tu i teraz, na waszym komputerze. To nie wizja przyszłości, a konkretny projekt zrealizowany przez polskich twórców we współpracy z NVIDIĄ i Kołem Naukowym BIT z krakowskiego AGH. Jego sercem są komputery z kartami Nvidia GeForce RTX serii 50, a efektem – gra, która udowadnia moc lokalnie działającej AI.
Projekt, który w całości działa na Twoim PC
Idea była odważna i konsekwentnie realizowana: stworzyć aplikację webową w stylu GeoGuessra, w której wszystkie panoramy zostały zmienione przez AI, tworząc artystyczne światy, które zachowują jednak swój rozpoznawalny charakter. Kluczowe założenie? Zero chmury, zero API, zero zewnętrznych serwerów. Cały proces – od generowania grafik po samą rozgrywkę – odbywa się w 100% lokalnie.
Za techniczną stronę przedsięwzięcia odpowiadali studenci z Koła Naukowego BIT AGH. To oni zajęli się najtrudniejszą częścią: od pozyskania panoram, przez opracowanie pipeline’u do transformacji obrazów, aż po budowę finalnej aplikacji. Całość w spójny projekt spiął Michał Tekieli (PCbyTQ), który odpowiadał za dostarczenie odpowiedniej platformy sprzętowej i co najważniejsze dał tym młodym utalentowanym osobom przestrzeń do opowiedzenia o całym procesie od strony technicznej.
Największym wyzwaniem było takie stylizowanie lokalizacji, aby nie zatracić ich kluczowych cech. Układ ulic, bryły budynków, charakterystyczne punkty – wszystko musiało pozostać czytelne. Zespół dopracował proces tak, aby panoramy 360° były w pełni spójne, bez widocznych łączeń i artefaktów.
Pod maską: Potęga architektury Blackwell
Do generowania lokacji zbudowano maszynę o bezkompromisowej specyfikacji. Sercem platformy była karta NVIDIA GeForce RTX 5090 z 32 GB pamięci VRAM, wspierana przez procesor Intel Core Ultra 9 285K, 64 GB RAM DDR5 i szybki dysk SSD o pojemności 4 TB. Całość osadzono na płycie głównej MSI Z890 Edge Ti i zamknięto w obudowie Corsair 7000D.
Taki zestaw nie był przypadkowy. Ogromna ilość pamięci VRAM, będąca kluczowym atutem architektury Blackwell, pozwoliła na płynne przejście od etapu eksperymentów do seryjnej produkcji materiałów. Praca na panoramach o wysokiej rozdzielczości i złożonych modelach AI stała się nie tylko możliwa, ale i efektywna czasowo.

Ekosystem RTX AI: Więcej niż tylko sprzęt
Wykorzystana w projekcie platforma to idealny przykład tego, co NVIDIA definiuje jako RTX AI PC. To nie tylko surowa moc, ale cały ekosystem technologii, który sprawia, że zaawansowana sztuczna inteligencja staje się dostępna lokalnie, z zachowaniem pełnej prywatności i wydajności. Technologia napędzająca światowe innowacje AI jest wbudowana w każdy układ GPU RTX, otwierając drzwi do niezwykłych możliwości.
Kluczowe filary platformy RTX AI to:
- Najwyższa wydajność: Akceleracja dla ponad 700 aplikacji i gier, od zastosowań studenckich (STEM) po profesjonalne narzędzia kreatywne.
- Prywatność i bezpieczeństwo: Uruchamianie modeli AI w 100% lokalnie oznacza, że Twoje dane nigdy nie opuszczają komputera. Nie ma potrzeby łączenia się z internetem, co gwarantuje pełną poufność.
- Wszechstronność: Ten sam sprzęt, który pozwala na błyskawiczne generowanie obrazów, jest jednocześnie potężną maszyną do gier, oferującą technologie takie jak DLSS 4 i Reflex 2.
Wydajność w liczbach mówi sama za siebie – w porównaniu do zestawu bez dedykowanego układu GPU, platforma RTX AI PC oferuje:
- 30x szybsze trenowanie modeli AI
- 8x wyższy poziom FPS w nowoczesnych grach
- 13x szybsze generowanie obrazów
NVIDIA NIM i Blueprints: Klocki dla Sztucznej Inteligencji
Prawdziwa rewolucja kryje się w oprogramowaniu. Dzięki mikrousługom NVIDIA NIM™ oraz AI Blueprints, deweloperzy i entuzjaści mogą eksperymentować, budować i wdrażać AI bezpośrednio na swoich komputerach. NIM to gotowe do użycia, zoptymalizowane modele AI, dostępne z poziomu ulubionych aplikacji, takich jak ChatRTX, ComfyUI czy LM Studio.
To właśnie dzięki takim narzędziom zespół BIT mógł skorzystać z modelu do projektowania wizualnego, który posłużył do przerobienia wybranych lokalizacji. Ekosystem NIM oferuje jednak znacznie więcej:
- Modele językowe: Rodzina Llama od Meta AI do rozumowania i kodowania.
- Modele mowy: NVIDIA Riva do transformacji audio na tekst.
- Modele wyszukiwania: Umożliwiające przeszukiwanie danych tekstowych i graficznych.
- Modele rozpoznawania obrazów: NV-CLIP do interpretacji treści wizualnych.
Dzięki temu deweloperzy nie muszą budować wszystkiego od zera. Mogą składać gotowe, zoptymalizowane „klocki” w nowe, potężne aplikacje, tak jak zrobiono to w opisywanym projekcie.
Od kodu do grywalnych lokacji
Zespół BIT, korzystając z ComfyUI, najpierw analizował panoramy pod kątem krawędzi, segmentacji i głębi. Dzięki temu model zachowywał kluczową strukturę sceny, nie zaburzając proporcji architektury. Proces zautomatyzowano za pomocą skryptów, co pozwoliło na szybkie testowanie różnych ustawień.
Gdy aplikacja nabrała kształtów, przetestowali ją popularni twórcy, mocno związani z rozgrywkami w GeoGuessr: Graf i Swangambit, sprawdzając, czy rozgrywka jest uczciwa i satysfakcjonująca. Swangambit zaangażował również swoją społeczność w konkurs na Instagramie, co pokazało, że nawet mocno stylizowane kadry pozostają rozpoznawalne.
Lokalna AI to teraźniejszość
Projekt ten doskonale ilustruje dwie fundamentalne kwestie. Po pierwsze, lokalne uruchamianie modeli AI daje pełną kontrolę nad procesem i niezależność od zewnętrznych usług. Po drugie, pokazuje, że odpowiednio dobrany sprzęt – zwłaszcza karta graficzna z dużą ilością VRAM i dostępem do ekosystemu takiego jak NVIDIA RTX AI – jest tym, co oddziela ciekawy prototyp od w pełni funkcjonalnego, skalowalnego projektu.
Projekt udowadnia, że era lokalnej AI jest już na wyciągnięcie ręki. Aby ułatwić start entuzjastom, którzy chcieliby pójść w ślady twórców, partner technologiczny projektu – x-kom – oferuje komponenty i gotowe zestawy o zweryfikowanej kompatybilności i wydajności w zastosowaniach AI. To konkretna odpowiedź na pytanie: „od czego zacząć?”.
Efekt końcowy to nie tylko grywalna aplikacja, ale potężny dowód na to, że era wydajnej, lokalnej sztucznej inteligencji na komputerach osobistych właśnie się rozpoczęła.
