MLOps 엔지니어 MLOps EngineerZenith의 Learning + Inference Infrastructure를 책임지는 Builder AI가 스스로 학습하는 인프라를 만드는 사람을 찾습니다Automata는 단순히 모델 API를 호출하는 회사가 아닙니다.우리는 AI가 실제 기업 운영의 결과로부터 스스로 학습하는 구조를 만들고 있습니다.대부분의 AI 시스템은 “학습이 끝나면 배포한다”는 단방향 구조입니다.Zenith는 다르게 작동합니다.Zenith 안에서 LLM은 ontology와 verifier 위에서 실행됩니다.그리고 그 실행 결과 — accept, deny, human confirmation, review, exception — 는 다시 RLVR 학습 신호가 됩니다.실행이 학습으로 돌아가고, 학습이 다시 더 나은 실행으로 이어지는 구조.이 closed loop의 학습, 추론, 배포 인프라를 책임질 MLOps Engineer를 찾고 있습니다.이 역할은 단순히 training script를 돌리는 일이 아닙니다.Zenith가 production에서 학습하고 진화할 수 있도록 만드는 infrastructure architect 역할입니다.
Position Overview
- MLOps Engineer는 Zenith의 learning + inference backbone을 설계하고 운영합니다.주요 책임 영역은 다음과 같습니다.RLVR + Verifier training pipeline
- Qwen / open-weight model fine-tuning
- GPU training infrastructurev
- LLM / TGI 기반 serving infrastructure
- Production model deployment
- Self-evolving loop automationMLOps observability & evaluation
- Multi-agent inference layer이 역할의 핵심은 하나입니다.Production에서 발생한 모든 실행 결과를 다시 학습 가능한 신호로 전환하는 것. What You’ll Work OnRLVR + Verifier Training Pipelineprime-rl, verifiers library, Zenith Engine의 /v1/verify bridge를 연결하여 verifier-driven learning pipeline을 구축합니다.LLM Fine-tuning
- Qwen 계열 open-weight model을 기반으로 LoRA, FSDP2, FP8, mixed precision optimization을 적용하고, 한국어 및 enterprise domain data에 맞게 fine-tune합니다.GPU Cluster Operations
- Lambda Labs, 자체 GPU, 고객사 cloud / BYO Compute 환경에서 training과 serving infrastructure를 설계하고 운영합니다.Inference Infrastructurev
- LLM, TGI, TensorRT-LLM 기반의 serving layer를 구축하고 latency, throughput, cost를 최적화합니다.Self-Evolving Loop Automation
- LLM proposal → verifier validation → feedback generation → training → axiom merge까지 이어지는 closed-loop learning pipeline을 자동화합니다.MLOps Observability
- Opik, Open
- Telemetry, W&B, MLflow 등을 활용하여 trace, drift, latency, hallucination, token-level accuracy를 추적합니다.Multi-Agent Inference Layer
- MCP, A2A, x402, AP2 등 agent-to-agent protocol을 Zenith Engine과 연결하고, multi-agent collaboration과 payment-aware workflow를 inference layer에 통합합니다.
Who We Are
- Looking For단순히 GPU를 잘 다루는 사람을 찾지 않습니다, 아래 질문들에 흥미를 느끼는 사람을 찾고 있습니다.왜 RLHF는 production에서 brittle한가LLM의 reward hacking을 어떻게 측정하고 막을 수 있는가verifier-driven learning은 어떻게 production-grade가 되는가큰 open-weight model을 한국어 enterprise domain에 어떻게 효율적으로 맞출 수 있는가AI가 사람보다 더 일관된 verifier가 될 수 있는가production failure를 어떻게 학습 신호로 바꿀 수 있는가이 질문들이 흥미롭다면, Automata와 잘 맞을 가능성이 높습니다. We Want to Work With People Who학습, 인프라, AI safety의 교차점에서 사고하는 사람모델의 불안정성을 measurable metric으로 바꾸는 사람production failure를 학습 데이터로 전환할 수 있는 사람GPU cost와 model accuracy 사이의 trade-off를 정량적으로 판단하는 사람“논문처럼 안 된다”는 현실을 이해하고 즐기는 사람academic frontier를 production system으로 가져오고 싶은 사람완벽한 경험을 가진 사람만 찾는 것은 아닙니다.Production-grade RLVR system을 처음부터 같이 만들어보고 싶은 builder라면 충분히 이야기해볼 가치가 있습니다. Technical Areas강한 candidate는 보통 아래 영역 중 3~4개 이상에서 깊이를 가집니다.AI / ML Training
- LLM fine-tuningPyTorch / Hugging
- Face / Deep
- Speed
- RLVR / RLHF / DPO / RLAIFConstitutional AIprime-rl / verifiers / DSPy / Text
- Grad
- Reward model design
- Reward hacking prevention
- MoE model training
- Infrastructure
- Distributed training
- FSDP2 / Deep
- Speed / Megatron-LMGPU cluster operations
- Kubernetes / SLURMLambda Labs / cloud GPU infrastructurev
- LLM / TGI / TensorRT-LLMFP8 / mixed precision optimization
- Multi-node training orchestration
- Observability + Evaluation
- Opik / W&B / MLflow
- Open
- Telemetry / Jaeger
- Token F1LLM-as-judge evaluation
- A/B testing
- Statistical evaluation
- Production model monitoring
- Drift / latency / hallucination tracking
- Integration
- HTTP API / RESTful services
- Elixir / Phoenix-friendly integration
- MCP / A2A / x402 / AP2Ontology / Knowledge Graph integration
- HIPAA / GDPR / Korean AI compliance-aware training The CAVE Framework이 역할은 CAVE Framework 중 Verification과 Evolution 영역에 깊게 관여합니다.V
- Verification4-tier dispatch, OPA policy, LLM verifier, cryptographic verification, RLVR 기반 검증 구조를 설계합니다.E
- Evolution
- LLM-driven schema proposal, verifier acceptance, feedback loop, axiom merge를 학습 인프라로 연결합니다.Self-Evolving Loop실행 결과가 다시 학습 데이터가 되고, 학습 결과가 다시 ontology와 verifier를 개선하는 loop를 자동화합니다. Why Automata대부분의 회사는 model API 호출과 prompt engineering에서 멈춥니다.우리는 그 다음 구조를 만들고 있습니다.AI가 production 결과를 보고, 실패를 학습하고, verifier를 개선하고, 다시 더 나은 판단을 하는 구조.이건 단순 MLOps 자동화가 아닙니다.AI Native Enterprise Operating System의 학습 backbone을 만드는 일입니다.RLVR, Constitutional AI, verifier-driven learning, agent-to-agent inference는 아직 완전히 정리된 시장이 아닙니다.바로 그래서 기회가 있습니다.이 영역이 production으로 넘어가는 순간, 가장 먼저 infrastructure를 만든 팀이 다음 10년의 AI 운영 표준을 결정하게 됩니다.Automata는 그 지점에 진입하고 있습니다. Final Note이 일은 쉽지 않습니다.RLHF brittleness, reward hacking, model drift, GPU cost, latency, compliance, enterprise deployment.문제는 매일 새로 나옵니다.하지만 분명한 것은 하나입니다.AI가 실제 기업 운영에서 학습하고 진화하려면, 그 아래에는 새로운 learning infrastructure가 필요합니다.Automata는 그 infrastructure를 만들고 있습니다. How to Apply다음 자료를 이메일로 보내주세요.RLHF / RLVR / fine-tuning / GPU training / production deployment 경험을 보여주는 자료 (GitHub / blog / papers / past projects 등 형식 자유)“
Who We Are
Looking For” 질문 중 12개에 대한 생각을 적어주세요. (12문단 분량)지원자격 (필수)한국 오피스(서울)에서 대면(On-site) 근무가 가능한 분한국어로 원활한 업무 커뮤니케이션이 가능한 분읽기, 쓰기, 말하기 모두 능통외국인의 경우 TOPIK 6급 이상 필수Apply / Inquirysupport@automata.ooo