Company
home
About VESSL AI
home
⚒️

Backend Engineer (Senior)

About VESSL AI

VESSL AI는 서울 강남과 미국 실리콘밸리에 오피스를 두고 있는 스타트업으로, AI 학습부터 배포까지 어떤 환경에서든 쉽고 빠르게 운영할 수 있는 end-to-end MLOps 플랫폼을 개발하고 있습니다
기업들이 AI 모델을 학습하고 운영하는 데 필요한 컴퓨팅 자원을 효율적으로 활용할 수 있도록 지원합니다. 이를 통해 모델의 학습, 배포, 운영이 간편해지고 신속하게 이루어지며, 비용 절감 효과도 기대할 수 있습니다. VESSL은 다양한 클라우드 및 온프레미스 환경에서 동일한 사용 경험을 제공하는 유일한 플랫폼입니다.
VESSL을 사용하면 Llama, Mistral, Stable Diffusion 등 최신 오픈소스 AI 모델의 학습 및 최적화 작업을 몇 분 만에 수행할 수 있습니다. 또한, 기업의 고유 데이터를 안전하게 연동하여 특화된 요구에 맞는 AI 서비스를 구축할 수 있으며, 이 모든 과정을 CI/CD 파이프라인을 통해 자동화할 수 있습니다.
General AI System, 그 새로운 도전을 향해 걸어가고 있습니다.
General AI System은 수백에서 수천 개에 이르는 다양한 AI 모델들이 서로 질의하고 협력하여 최적의 의사결정을 내리는 시스템입니다. VESSL AI는 지금까지 개발해온 end-to-end MLOps 플랫폼을 기반으로 General AI System을 구축하여, 인류가 더 빠르고 효율적으로 AGI(일반인공지능)에 도달할 수 있도록 기여하고자 합니다.
Agentic Workflow는 다양한 AI 모델(에이전트)들이 각각 독립적으로 동작하면서도 상호 협력하여 복잡한 문제를 해결하는 방식을 의미합니다. 이 방식을 효과적으로 구현하려면 수많은 AI의 학습, 배포, 모니터링을 효율적으로 관리할 수 있어야 하며, AI들 간의 지속적인 네트워킹을 원활하게 지원할 수 있는 인프라가 필요합니다. VESSL AI는 Agentic Workflow를 빠르고 안정적으로 운영할 수 있는 인프라를 구축해나가고 있습니다.

About the Role

VESSL AI는 MLOps 플랫폼의 성장과 고도화를 이끌어 갈 경험 많은 시니어 소프트웨어 엔지니어를 찾고 있습니다.
이 포지션은 코드 작성 및 배포와 더불어, 서비스를 더 안정적이고 효율적으로 만들기 위해 복잡한 기술적 문제를 풀고 지속 가능한 시스템을 설계하여, 제품의 기술적 전략 수립에 기여할 수 있는 역할입니다.
프로젝트를 주도하고, 고객의 기술적 문제를 해결하며, 팀 내 동료들의 성장을 지원하는 등 팀의 기술적 리더로서 활약하실 분들의 지원을 기다립니다.

What you will do

Golang, Python, Kubernetes 등을 이용하여 VESSL AI Platform의 서비스 백엔드를 개발합니다.
제품의 핵심 비즈니스 로직의 설계와 구현, 배포와 모니터링 등 제품 개발 프로세스의 처음부터 마지막까지 소프트웨어 엔지니어로서 기여합니다.
클라우드/컨테이너 기반의 머신러닝 워크로드 가상화, 더 빠른 워크로드 실행을 위한 네트워크 및 스토리지 최적화,각 워크로드로부터 발생하는 대량의 로그와 메트릭 수집과 같은 기술을 연구하고 플랫폼에 적용합니다.
제품과 인프라 상의 문제점을 진단하고 스스로 해결책을 제시합니다.
프로젝트 진행시 업무 분배와 일정 조율을 맡아 리드하게 됩니다.
고객사에서 겪고 있는 문제를 듣고, 문제를 해결하기 위한 적절한 해결책을 제시합니다. 필요시 고객사 기술팀을 직접 만나 지원합니다.
팀 내 엔지니어들의 온보딩을 돕고 업무 및 커리어 관련 멘토링을 진행합니다.

Qualifications

최소 5년 이상의 소프트웨어 개발 경력
프로젝트나 팀의 리드로서 구성원의 효율적인 협업을 이끌어내어 제품 출시/운영/개선을 이끌어낸 경험
ML/AI과 MLOps에 대한 관심이 있고 AI 시장의 트렌드를 빠르게 따라가실 수 있는 분
Golang, Python 등 백엔드 개발에 사용되는 언어에 대한 심도 깊은 이해 및 사용 경험
Docker, Kubernetes 등 container 기반 orchestration에 대한 이해 혹은 사용 경험
AWS, GCP, Azure 등 cloud platform에 대한 이해 혹은 사용 경험
엔지니어링 문제에 대한 높은 수준의 문제 해결 능력과 협업/커뮤니케이션 능력
웹 서비스 개발, 배포, 운영 과정 전반에 대한 높은 이해도
비용, 일정 등 외부 요인에 맞춰서 적절한 문제 해결 방법을 선택할 수 있는 능력

Helpful experience (not required)

AI Infra / Cloud 분야에서의 업무 경험 혹은 높은 이해도 - PyTorch, TensorRT, CUDA, VertexAI, Sagemaker, Kubeflow
등의 키워드에 대한 배경 지식, 이해도 혹은 사용 경험
머신러닝 모델의 실 서비스 적용에 대한 경험
문서 작성 / 기술 대응 / 세미나 등 B2B 소프트웨어 프로덕트에서 외부 고객과의 업무 커뮤니케이션 경험

Life & Benefit

주 2회 선택적 Remote 근무제 시행
시차출퇴근제 운영(오전 8시 ~ 11시 자율 출근제)
도서 구매 및 전자도서관 이용 지원
구성원 간 영어 닉네임 사용
개인 간식비 지원
구성원 간 1on1 비용 지원
(필요 시) 제한 없는 저녁식대 지원
격주 Allhands + Team Gathering 활동 진행
경조금 + 경조사 휴가 지원
연 1회 건강검진 지원 및 건강검진 휴가 지원
입사N주년 축하선물 제공
장기근속자 리프레쉬 휴가 제공
명절 선물 제공

Location