반응형

Ai 2

온프레미스 환경에서 Ollama + Open WebUI로 사내 LLM 구축하기

Overview최근 AI 기술의 발전으로 ChatGPT, Claude 같은 상용 LLM 서비스가 대중화되었지만, 보안이 중요한 기업 환경에서는 민감한 데이터를 외부 API로 전송하기 어려운 경우가 많다. 이러한 상황에서 온프레미스 환경에 자체 LLM을 구축하면 데이터 보안을 유지하면서도 AI의 이점을 활용할 수 있다. 이번 글에서는 NVIDIA GPU가 장착된 물리 서버에 Ollama를 설치하고, Open WebUI를 통해 웹 인터페이스를 제공하는 사내 LLM 시스템을 구축하는 전체 과정을 다룬다. NFS를 활용한 스토리지 관리와 Docker Compose를 이용한 컨테이너 오케스트레이션까지 포함하여 실무에 바로 적용 가능한 완전한 솔루션을 제시한다. 시스템 구성 및 사전 요구사항 하드웨어 환경..

AI/AI Tool 2026.02.11

Claude 4.5 Sonnet vs Gemini 3 Pro 비교: 2026년 최신 AI 모델 대결

Overview2025년 말부터 2026년 초까지, AI 업계에서 가장 주목받는 두 모델이 등장했다. Anthropic의 Claude 4.5 Sonnet과 Google의 Gemini 3 Pro는 각각 2025년 9월과 11월에 출시되어 AI 모델의 새로운 기준을 제시하고 있다. 개발자 관점에서 이 두 모델을 심층 비교해보겠다. 1. 기본 스펙 비교 Claude 4.5 Sonnet출시일: 2025년 9월 29일학습 데이터 기준: 2025년 4월컨텍스트 윈도우: 200K 토큰 (기본), 1M 토큰 (베타)가격: 입력 $3/M 토큰, 출력 $15/M 토큰특징: 코딩 특화, 에이전트 워크플로우 최적화 Gemini 3 Pro출시일: 2025년 11월 18일학습 데이터 기준: 2025년 1월컨텍스트 윈..

AI/AI Tool 2026.01.17
반응형