About VESSL AI
VESSL AI는 서울 강남과 미국 실리콘밸리에 오피스를 두고 있는 스타트업으로, AI 학습부터 배포까지 어떤 환경에서든 쉽고 빠르게 운영할 수 있는 end-to-end MLOps 플랫폼을 개발하고 있습니다
•
기업들이 AI 모델을 학습하고 운영하는 데 필요한 컴퓨팅 자원을 효율적으로 활용할 수 있도록 지원합니다. 이를 통해 모델의 학습, 배포, 운영이 간편해지고 신속하게 이루어지며, 비용 절감 효과도 기대할 수 있습니다. VESSL은 다양한 클라우드 및 온프레미스 환경에서 동일한 사용 경험을 제공하는 유일한 플랫폼입니다.
•
VESSL을 사용하면 Llama, Mistral, Stable Diffusion 등 최신 오픈소스 AI 모델의 학습 및 최적화 작업을 몇 분 만에 수행할 수 있습니다. 또한, 기업의 고유 데이터를 안전하게 연동하여 특화된 요구에 맞는 AI 서비스를 구축할 수 있으며, 이 모든 과정을 CI/CD 파이프라인을 통해 자동화할 수 있습니다.
General AI System, 그 새로운 도전을 향해 걸어가고 있습니다.
•
General AI System은 수백에서 수천 개에 이르는 다양한 AI 모델들이 서로 질의하고 협력하여 최적의 의사결정을 내리는 시스템입니다. VESSL AI는 지금까지 개발해온 end-to-end MLOps 플랫폼을 기반으로 General AI System을 구축하여, 인류가 더 빠르고 효율적으로 AGI(일반인공지능)에 도달할 수 있도록 기여하고자 합니다.
•
Agentic Workflow는 다양한 AI 모델(에이전트)들이 각각 독립적으로 동작하면서도 상호 협력하여 복잡한 문제를 해결하는 방식을 의미합니다. 이 방식을 효과적으로 구현하려면 수많은 AI의 학습, 배포, 모니터링을 효율적으로 관리할 수 있어야 하며, AI들 간의 지속적인 네트워킹을 원활하게 지원할 수 있는 인프라가 필요합니다. VESSL AI는 Agentic Workflow를 빠르고 안정적으로 운영할 수 있는 인프라를 구축해나가고 있습니다.
About the Role
VESSL AI는 MLOps 플랫폼의 성장과 고도화를 이끌어 갈 경험 많은 시니어 소프트웨어 엔지니어를 찾고 있습니다.
•
이 포지션은 코드 작성 및 배포와 더불어, 서비스를 더 안정적이고 효율적으로 만들기 위해 복잡한 기술적 문제를 풀고 지속 가능한 시스템을 설계하여, 제품의 기술적 전략 수립에 기여할 수 있는 역할입니다.
•
프로젝트를 주도하고, 고객의 기술적 문제를 해결하며, 팀 내 동료들의 성장을 지원하는 등 팀의 기술적 리더로서 활약하실 분들의 지원을 기다립니다.
What you will do
•
Golang, Python, Kubernetes 등을 이용하여 VESSL AI Platform의 서비스 백엔드를 개발합니다.
•
제품의 핵심 비즈니스 로직의 설계와 구현, 배포와 모니터링 등 제품 개발 프로세스의 처음부터 마지막까지 소프트웨어 엔지니어로서 기여합니다.
•
클라우드/컨테이너 기반의 머신러닝 워크로드 가상화, 더 빠른 워크로드 실행을 위한 네트워크 및 스토리지 최적화,각 워크로드로부터 발생하는 대량의 로그와 메트릭 수집과 같은 기술을 연구하고 플랫폼에 적용합니다.
•
제품과 인프라 상의 문제점을 진단하고 스스로 해결책을 제시합니다.
•
프로젝트 진행시 업무 분배와 일정 조율을 맡아 리드하게 됩니다.
•
고객사에서 겪고 있는 문제를 듣고, 문제를 해결하기 위한 적절한 해결책을 제시합니다. 필요시 고객사 기술팀을 직접 만나 지원합니다.
•
팀 내 엔지니어들의 온보딩을 돕고 업무 및 커리어 관련 멘토링을 진행합니다.
Qualifications
•
최소 5년 이상의 소프트웨어 개발 경력
•
프로젝트나 팀의 리드로서 구성원의 효율적인 협업을 이끌어내어 제품 출시/운영/개선을 이끌어낸 경험
•
ML/AI과 MLOps에 대한 관심이 있고 AI 시장의 트렌드를 빠르게 따라가실 수 있는 분
•
Golang, Python 등 백엔드 개발에 사용되는 언어에 대한 심도 깊은 이해 및 사용 경험
•
Docker, Kubernetes 등 container 기반 orchestration에 대한 이해 혹은 사용 경험
•
AWS, GCP, Azure 등 cloud platform에 대한 이해 혹은 사용 경험
•
엔지니어링 문제에 대한 높은 수준의 문제 해결 능력과 협업/커뮤니케이션 능력
•
웹 서비스 개발, 배포, 운영 과정 전반에 대한 높은 이해도
•
비용, 일정 등 외부 요인에 맞춰서 적절한 문제 해결 방법을 선택할 수 있는 능력
Helpful experience (not required)
•
AI Infra / Cloud 분야에서의 업무 경험 혹은 높은 이해도 - PyTorch, TensorRT, CUDA, VertexAI, Sagemaker, Kubeflow
등의 키워드에 대한 배경 지식, 이해도 혹은 사용 경험
•
머신러닝 모델의 실 서비스 적용에 대한 경험
•
문서 작성 / 기술 대응 / 세미나 등 B2B 소프트웨어 프로덕트에서 외부 고객과의 업무 커뮤니케이션 경험
Life & Benefit
•
주 2회 선택적 Remote 근무제 시행
•
시차출퇴근제 운영(오전 8시 ~ 11시 자율 출근제)
•
도서 구매 및 전자도서관 이용 지원
•
구성원 간 영어 닉네임 사용
•
개인 간식비 지원
•
구성원 간 1on1 비용 지원
•
(필요 시) 제한 없는 저녁식대 지원
•
격주 Allhands + Team Gathering 활동 진행
•
경조금 + 경조사 휴가 지원
•
연 1회 건강검진 지원 및 건강검진 휴가 지원
•
입사N주년 축하선물 제공
•
장기근속자 리프레쉬 휴가 제공
•
명절 선물 제공