AI-DrivenDistributed Computing
사양이 낮은 유휴 PC를 활용하여 고성능 분산 컴퓨팅 클러스터를 구축하고,
Agentic AI를 통해 자율적으로 운영하는 Self-Organizing Super Cluster 플랫폼
실시간 클러스터 모니터링
50개 이상의 노드를 한눈에 파악하고 제어하세요. 직관적인 대시보드로 클러스터의 모든 상태를 실시간으로 확인할 수 있습니다.
클러스터 상태
50+ 노드 실시간 모니터링
각 노드의 상태(Idle/Busy/Offline)를 색상과 애니메이션으로 실시간 시각화합니다.
3D 배경 애니메이션
Three.js 기반의 인터랙티브 3D 시각화로 클러스터 토폴로지를 직관적으로 표현합니다.
작업 제어 패널
Job 시작/중지/리셋 기능을 원클릭으로 제어. 노드별 작업 할당과 상태 관리가 가능합니다.
실시간 로그 터미널
작업 결과를 실시간 스트리밍으로 확인. 에러 추적과 디버깅이 용이합니다.
성능 메트릭 대시보드
CPU, 메모리, 네트워크 사용률을 실시간으로 모니터링하고 분석합니다.
노드 상태 시각화
Idle(초록), Busy(주황), Offline(빨강) 상태를 직관적인 색상으로 구분합니다.
Agentic AI 기반 자율 운영
자연어로 명령하면 AI 에이전트가 스스로 코드를 작성하고, 배포하고, 에러를 수정합니다. LangGraph 기반의 Self-Organizing Super Cluster를 경험하세요.
Natural Language Input
자연어로 명령을 입력하세요
Agent Reasoning Log
에이전트 사고 과정
작업 분석 중... MapReduce 패턴이 적합합니다.
소수 판별 알고리즘 작성 중... 에라토스테네스의 체 적용.
1~20번 노드에 코드 배포 시작. Redis Pub/Sub 브로드캐스팅.
실행 상태 감시 중... 모든 노드 정상 동작.
LangGraph Workflow
Self-Correction Loop
핵심 이점
어떤 작업이든 자연어로 명령하면 AI가 코드를 작성
에러 발생 시 자동 디버깅 및 재배포
Python 지식 없이도 분산 컴퓨팅 활용 가능
Zero-Touch OS 자동 설치
랜선만 꽂혀 있으면 끝! PXE Boot와 Ubuntu Autoinstall로 OS 설치부터 Worker 배포까지 완전 자동화. 10대의 PC도 전원 버튼만 누르면 됩니다.
PXE 서버 구축
DHCP, TFTP, HTTP 서버 설정
user-data 작성
Cloud-Init 자동 설치 스크립트
네트워크 부팅
NUC BIOS에서 PXE Boot 설정
자동 배포 완료
Worker 서비스 자동 시작
PXE Server 상태
Master PC Services
설치 진행 상황
Node #7 - ubuntu-worker-07
user-data (Cloud-Init)
자동 설치 설정 파일
1#cloud-config2autoinstall:3 version: 14 identity:5 hostname: ubuntu-worker6 username: ubuntu7 storage:8 layout:9 name: direct # Windows 덮어쓰기10 packages:11 - git12 - python3-pip13 - redis-tools14 late-commands:15 - curtin in-target -- git clone ...16 - curtin in-target -- systemctl enable worker
왜 PXE Boot인가?
엔터프라이즈급 고급 기능
Docker Sandbox, vLLM, CrewAI, DAG 시각화, Auto-Scaler, GPU 클러스터,
Web Code Editor, Job Scheduler, Cost Analytics까지. 10가지 고급 기능과 Enterprise 기능(v4.0)을 제공합니다.
Docker Sandbox
격리된 코드 실행 환경
vLLM Local LLM
로컬 GPU LLM 서빙
CrewAI Multi-Agent
다중 에이전트 협업
DAG Visualization
작업 의존성 시각화
Auto-Scaler
CPU/메모리 기반 자동 스케일링
Docker Sandbox
AI가 생성한 코드를 안전하게 실행하기 위한 격리된 Docker 컨테이너 환경을 제공합니다. 검증되지 않은 코드도 시스템에 영향 없이 실행할 수 있습니다.
GPU Cluster
NVIDIA GPU 통합 관리
Web Code Editor
브라우저 기반 코드 편집
Job Scheduler
정기 작업 예약 관리
Cost & Analytics
비용 분석 대시보드
Enterprise Integration
K8s 및 분산 학습
Enterprise Features v4.3
프로덕션 환경을 위한 엔터프라이즈급 기능과 메신저 통합을 완벽하게 지원합니다.
TerminaI 보안 정책, Telegram/Discord/KakaoTalk 봇, OAuth2/OIDC, Prometheus 모니터링까지.
Production Authentication
3 features
Monitoring & Observability
3 features
High Availability
3 features
ML Pipeline
3 features
Plugin System
3 features
TerminaI Integration (v4.1)
3 features
Boltbot Integration (v4.3)
3 features
KakaoTalk Bridge (v4.3.1)
4 features
Production Authentication
Enterprise Feature v4.0 ~ v4.3.1
OAuth2/OIDC
Google, GitHub, Microsoft, Okta 등 주요 OAuth 제공자 통합
LDAP/Active Directory
엔터프라이즈 디렉토리 서비스와 완벽 통합
Multi-Factor Authentication
TOTP, 백업 코드, 이메일 인증을 통한 2단계 보안
Total Code Lines
~34,500 lines
Boltbot (v4.3)
~4,200 lines
KakaoTalk Bridge
NEW
Status
Production Ready
기술 스택 & 시스템 요구사항
검증된 오픈소스 기술들을 결합하여 안정적이고 확장 가능한 시스템을 구축했습니다.
App Router 기반 풀스택 프레임워크
타입 안정성
유틸리티 기반 스타일링
3D 시각화
UI 애니메이션
고성능 Python API 서버
HA 메시지 브로커 (v4.0)
실시간 양방향 통신
컨테이너 샌드박스
자동화 배포 도구
에이전트 워크플로우 오케스트레이션
다중 에이전트 협업
로컬 GPU LLM 서빙
Model Registry/Training (v4.0)
대규모 언어 모델
Google, GitHub, MS, Okta
메트릭 수집 및 모니터링
대시보드 시각화
분산 추적 시스템
컨테이너 오케스트레이션
시스템 요구사항
Master Node
권장
AI 모델 사용 시 32GB 권장
vLLM 사용 시 필수
Docker 이미지 저장용
안정적인 환경
Worker Node
아키텍처
권장
유선 LAN 필수
PXE Boot 활성화
Software
Master/Worker 공통
런타임
메시지 브로커
샌드박스 실행
System Architecture
Quick Start
git clone <REPO_URL> ai_cluster_pc프로젝트 클론cd ai_cluster_pc && pip install -r requirements.txt의존성 설치sudo service redis-server startRedis 시작python src/server.py서버 실행http://localhost:8200 접속