Tinder
Machine Learning Research Engineer (HYPERCONNECT AI | 전문연구요원 편입/전직 가능)
Tinder, Los Angeles, California, United States, 90079
Overview
하이퍼커넥트 AI Lab은 사람과 사람 사이를 연결하는 제품에서 기존의 기술로는 접근하기 어렵지만 머신러닝 기술로 풀 수 있는 문제들을 찾아내고 해결하여 사용자 경험을 혁신합니다. 영상/음성/자연어/추천 등을 포함한 다양한 도메인의 모델을 개발하고, 모바일 및 클라우드 서버를 통해 안정적으로 제공하며 AI Lab이 기술로 제품의 성장에 기여하는 것을 목표로 합니다. AI Lab은 아자르를 포함한 하이퍼커넥트의 제품에 기여하는 머신러닝 기술을 수년간 발전시키고 있습니다. ML Research Engineer는 최첨단 모델을 연구하고 개선하는 과학자이자, 현실적인 제약사항들을 종합적으로 고려해 기술적 의사결정을 하는 엔지니어로서의 역량이 필요합니다. 이 직무의 목표는 실제 제품에서 겪는 문제를 발견하고 이를 AI 문제로 정의해 해결하는 데 있습니다. 백엔드/프론트엔드/DevOps/ML소프트웨어 엔지니어, 데이터 과학자/분석가, PM 등 다양한 전문조직과 협업합니다. 자세한 내용은 아래의 항목들을 참고하시기 바랍니다.
ML Research Engineer 역할 및 포지션 특징
ML Research Engineer는 문제 해결 과정을 일종의 연구로 바라보고, 문제 정의, 이해관계자 설득, 목표 설정, SotA 모델 도출, 일정 관리, 성과 분석, 향후 전략 설정까지 A-Z를 주도적으로 담당합니다. 사용자의 요구와 비즈니스 임팩트를 고려해 우선순위를 정의하고, 장기적인 관점에서 제품의 성장을 AI 관점으로 기여합니다. 일부 성과는 논문 또는 오픈소스 코드로 외부에 공개하기도 합니다. 제품에 활용하기 위한 목적으로 ML 모델을 개발하다 보면 기존 연구로는 부족한 경우가 많으므로, 연구의 의미 있는 부분을 정돈하고 가능하다면 코드와 함께 공개합니다. 이를 통해 아래와 같은 대외적 연구 성과를 얻었습니다.
2024년 : CUPID: 1:1 소셜 디스커버리 플랫폼을 위한 실시간 세션 기반 상호 추천 시스템 ICDM Workshop 발표
2023년 : TiDAL: 효율적인 학습 과정의 모델 행동에 기반한 액티브 러닝 기법 ICCV 2023 게재
2023년 : 모더레이션 환경에서 여러 분류 기준을 동시에 만족하기 위한 문턱값을 잡는 연구 WSDM 2023 게재
2022년 : 대화 생성에서의 의미적 다양성을 높이는 연구 EMNLP 2022 게재
2022년 : 레이블 노이즈가 심한 환경에서 효과적으로 학습하는 방법 ECCV 2022 게재
2022년 : 타깃 캐릭터의 발화 일부만으로 타깃 캐릭터를 모방하는 챗봇 연구 NAACL 2022 게재
2022년 : 대화 생성 모델에서 예시를 활용해 성능을 높이는 연구 ACL 2022 Workshop 발표
2022년 : 모바일 환경에서 오디오 분류를 위한 distillation 기술 연구 ICASSP 게재
AI로 비즈니스 문제를 해결하기 위해서는 인프라도 제대로 갖춰져야 합니다. 하이퍼커넥트는 ML Research Engineer들이 충분히 모델 개발 및 실험을 진행할 수 있도록 자체적인 딥러닝 연구용 클러스터를 구축하여 활용하고 있습니다. 총 160대의 A100 GPU 및 다수의 H100 GPU를 포함한 다양한 on-premise 장비들을 연구개발에 활용할 수 있습니다. 또한 데이터 수집/전처리를 포함한 자체 데이터 파이프라인을 클라우드 서비스를 활용해 구축 및 운영합니다.
Contents Understanding - Responsibilities/업무 소개
AI Lab의 contents understanding 업무는 영상/이미지, 음성, 자연어로 구성된 비정형 데이터를 입력으로 받아 비즈니스에 유용한 정보를 추출하는 데 집중하며, 모더레이션을 통한 신뢰와 안전(Trust & Safety) 업무에 기여하는 것을 주 목표로 합니다. 하이퍼커넥트 및 Match Group 브랜드에서 생성되는 콘텐츠를 이해하는 데 기여하며 글로벌 신뢰와 안전 기준을 충족하기 위해 Match Group과 협력합니다. 아래와 같은 AI 문제들에 관심이 많습니다.
모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법
노이즈와 불균형이 심한 데이터에서 레이블 품질을 추적·관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set 선택, semi-/self-supervised 학습 방법
다중 작업(multitask) 또는 다중 라벨 분류를 제한된 파라미터 예산에서 최적화하고, 텍스트/이미지/영상 등 멀티모달 정보를 통합하는 모델링 기법
도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 메타 러닝 기법
국제 AI 기준에 맞춘 공정성(Fairness) 및 프라이버시 보장을 위한 학습 방법
사용자 행동 로그와 콘텐츠 분석 정보를 활용한 실시간 스팸·가짜 계정 탐지 및 사전 예측
ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법
Requirements AI/ML 도메인 전반에 대한 이해와 적어도 한 개의 특정 도메인에 대한 깊이 있는 지식 보유
AI 기술의 제품화에 대한 높은 관심
AI를 통한 문제 해결 역량 및 이를 위한 프로젝트 관리 역량 보유
TensorFlow, PyTorch, CatBoost, JAX 등 오픈소스 프레임워크 기반 개발과 파이썬 역량 보유
강한 오너십으로 프로젝트의 A-Z를 책임지고 완수 가능
다양한 직군 이해관계자와의 협업을 위한 강력한 커뮤니케이션 능력
ML 시스템의 소프트웨어 개발 구조와 내용을 이해하고 기능 기획이 가능한 엔지니어링 역량
데이터의 통계적 특성과 패턴을 발견하고 이를 AI 문제 해결에 반영 가능
A/B 테스트 이해 및 SQL 기반의 데이터 분석 역량
학위나 국적 무관, 한국어로 원활한 의사소통 가능
Preferred Qualifications 기계학습 관련 탑티어 학회/저널 게재 실적 또는 AI 대회 수상 실적 보유
AI/ML 도메인에 대한 폭넓은 지식 보유
실제 서비스에 AI 기술을 통합하여 주요 지표를 향상시킨 경험
PO/PM 혹은 그에 준하는 경험
영어로 원활한 의사소통 가능
인과관계 분석(DID/RCT/Causal Inference 등), 다변량 테스트, Sequential Testing 이해
제출해 주신 내용 중 허위 사실이 있거나 관련 법 상 근로제공에 결격사유가 있는 경우 채용이 취소될 수 있으며, 필요 시 추가 전형 및 서류 확인이 진행될 수 있습니다. 국가보훈대상자는 관계 법령에 따라 우대합니다. 하이퍼커넥트가 채용하는 포지션에 지원하는 경우 개인정보 처리에 관하여 본 개인정보처리방침이 적용됩니다:
https://career.hyperconnect.com/privacy
#HPCNT
#J-18808-Ljbffr
하이퍼커넥트 AI Lab은 사람과 사람 사이를 연결하는 제품에서 기존의 기술로는 접근하기 어렵지만 머신러닝 기술로 풀 수 있는 문제들을 찾아내고 해결하여 사용자 경험을 혁신합니다. 영상/음성/자연어/추천 등을 포함한 다양한 도메인의 모델을 개발하고, 모바일 및 클라우드 서버를 통해 안정적으로 제공하며 AI Lab이 기술로 제품의 성장에 기여하는 것을 목표로 합니다. AI Lab은 아자르를 포함한 하이퍼커넥트의 제품에 기여하는 머신러닝 기술을 수년간 발전시키고 있습니다. ML Research Engineer는 최첨단 모델을 연구하고 개선하는 과학자이자, 현실적인 제약사항들을 종합적으로 고려해 기술적 의사결정을 하는 엔지니어로서의 역량이 필요합니다. 이 직무의 목표는 실제 제품에서 겪는 문제를 발견하고 이를 AI 문제로 정의해 해결하는 데 있습니다. 백엔드/프론트엔드/DevOps/ML소프트웨어 엔지니어, 데이터 과학자/분석가, PM 등 다양한 전문조직과 협업합니다. 자세한 내용은 아래의 항목들을 참고하시기 바랍니다.
ML Research Engineer 역할 및 포지션 특징
ML Research Engineer는 문제 해결 과정을 일종의 연구로 바라보고, 문제 정의, 이해관계자 설득, 목표 설정, SotA 모델 도출, 일정 관리, 성과 분석, 향후 전략 설정까지 A-Z를 주도적으로 담당합니다. 사용자의 요구와 비즈니스 임팩트를 고려해 우선순위를 정의하고, 장기적인 관점에서 제품의 성장을 AI 관점으로 기여합니다. 일부 성과는 논문 또는 오픈소스 코드로 외부에 공개하기도 합니다. 제품에 활용하기 위한 목적으로 ML 모델을 개발하다 보면 기존 연구로는 부족한 경우가 많으므로, 연구의 의미 있는 부분을 정돈하고 가능하다면 코드와 함께 공개합니다. 이를 통해 아래와 같은 대외적 연구 성과를 얻었습니다.
2024년 : CUPID: 1:1 소셜 디스커버리 플랫폼을 위한 실시간 세션 기반 상호 추천 시스템 ICDM Workshop 발표
2023년 : TiDAL: 효율적인 학습 과정의 모델 행동에 기반한 액티브 러닝 기법 ICCV 2023 게재
2023년 : 모더레이션 환경에서 여러 분류 기준을 동시에 만족하기 위한 문턱값을 잡는 연구 WSDM 2023 게재
2022년 : 대화 생성에서의 의미적 다양성을 높이는 연구 EMNLP 2022 게재
2022년 : 레이블 노이즈가 심한 환경에서 효과적으로 학습하는 방법 ECCV 2022 게재
2022년 : 타깃 캐릭터의 발화 일부만으로 타깃 캐릭터를 모방하는 챗봇 연구 NAACL 2022 게재
2022년 : 대화 생성 모델에서 예시를 활용해 성능을 높이는 연구 ACL 2022 Workshop 발표
2022년 : 모바일 환경에서 오디오 분류를 위한 distillation 기술 연구 ICASSP 게재
AI로 비즈니스 문제를 해결하기 위해서는 인프라도 제대로 갖춰져야 합니다. 하이퍼커넥트는 ML Research Engineer들이 충분히 모델 개발 및 실험을 진행할 수 있도록 자체적인 딥러닝 연구용 클러스터를 구축하여 활용하고 있습니다. 총 160대의 A100 GPU 및 다수의 H100 GPU를 포함한 다양한 on-premise 장비들을 연구개발에 활용할 수 있습니다. 또한 데이터 수집/전처리를 포함한 자체 데이터 파이프라인을 클라우드 서비스를 활용해 구축 및 운영합니다.
Contents Understanding - Responsibilities/업무 소개
AI Lab의 contents understanding 업무는 영상/이미지, 음성, 자연어로 구성된 비정형 데이터를 입력으로 받아 비즈니스에 유용한 정보를 추출하는 데 집중하며, 모더레이션을 통한 신뢰와 안전(Trust & Safety) 업무에 기여하는 것을 주 목표로 합니다. 하이퍼커넥트 및 Match Group 브랜드에서 생성되는 콘텐츠를 이해하는 데 기여하며 글로벌 신뢰와 안전 기준을 충족하기 위해 Match Group과 협력합니다. 아래와 같은 AI 문제들에 관심이 많습니다.
모바일 및 웹 환경에서 짧은 레이턴시와 낮은 전력 소비를 유지하면서도 높은 정확도를 달성할 수 있는 경량 모델 설계 및 최적화 기법
노이즈와 불균형이 심한 데이터에서 레이블 품질을 추적·관리하고, 최소한의 라벨링으로 성능을 확보하기 위한 액티브 러닝, core-set 선택, semi-/self-supervised 학습 방법
다중 작업(multitask) 또는 다중 라벨 분류를 제한된 파라미터 예산에서 최적화하고, 텍스트/이미지/영상 등 멀티모달 정보를 통합하는 모델링 기법
도메인 간 분포 차이를 극복하는 도메인 적응, 서비스 확장성을 위한 메타 러닝 기법
국제 AI 기준에 맞춘 공정성(Fairness) 및 프라이버시 보장을 위한 학습 방법
사용자 행동 로그와 콘텐츠 분석 정보를 활용한 실시간 스팸·가짜 계정 탐지 및 사전 예측
ML 프로덕션 프로세스를 혁신하기 위한 LLM 활용 방법
Requirements AI/ML 도메인 전반에 대한 이해와 적어도 한 개의 특정 도메인에 대한 깊이 있는 지식 보유
AI 기술의 제품화에 대한 높은 관심
AI를 통한 문제 해결 역량 및 이를 위한 프로젝트 관리 역량 보유
TensorFlow, PyTorch, CatBoost, JAX 등 오픈소스 프레임워크 기반 개발과 파이썬 역량 보유
강한 오너십으로 프로젝트의 A-Z를 책임지고 완수 가능
다양한 직군 이해관계자와의 협업을 위한 강력한 커뮤니케이션 능력
ML 시스템의 소프트웨어 개발 구조와 내용을 이해하고 기능 기획이 가능한 엔지니어링 역량
데이터의 통계적 특성과 패턴을 발견하고 이를 AI 문제 해결에 반영 가능
A/B 테스트 이해 및 SQL 기반의 데이터 분석 역량
학위나 국적 무관, 한국어로 원활한 의사소통 가능
Preferred Qualifications 기계학습 관련 탑티어 학회/저널 게재 실적 또는 AI 대회 수상 실적 보유
AI/ML 도메인에 대한 폭넓은 지식 보유
실제 서비스에 AI 기술을 통합하여 주요 지표를 향상시킨 경험
PO/PM 혹은 그에 준하는 경험
영어로 원활한 의사소통 가능
인과관계 분석(DID/RCT/Causal Inference 등), 다변량 테스트, Sequential Testing 이해
제출해 주신 내용 중 허위 사실이 있거나 관련 법 상 근로제공에 결격사유가 있는 경우 채용이 취소될 수 있으며, 필요 시 추가 전형 및 서류 확인이 진행될 수 있습니다. 국가보훈대상자는 관계 법령에 따라 우대합니다. 하이퍼커넥트가 채용하는 포지션에 지원하는 경우 개인정보 처리에 관하여 본 개인정보처리방침이 적용됩니다:
https://career.hyperconnect.com/privacy
#HPCNT
#J-18808-Ljbffr