Machine Learning Engineer (MG AI)
Seoul
MG AI ์๊ฐ
MG AI๋ ํ์ดํผ์ปค๋ฅํธ์ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ Tinder, Hinge๋ฅผ ๋น๋กฏํ ๋งค์น๊ทธ๋ฃน์ ๋ค์ํ ์ ํ์ ๊ธฐ์ฌํ๊ณ ์์ต๋๋ค. ๋ํ ๊ธฐ์กด์ ๊ธฐ์ ๋ก๋ ์ ๊ทผํ๊ธฐ ์ด๋ ต์ง๋ง ๋จธ์ ๋ฌ๋ ๊ธฐ์ ์ ํตํด ํ ์ ์๋ ๋ฌธ์ ๋ค์ ์ฐพ์๋ด๊ณ ํด๊ฒฐํ์ฌ ์ฌ์ฉ์ ๊ฒฝํ์ ํ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ฌ์ฉ์๋ค์ด ์์ ์ ๋ ์ ํํํ ์ ์๋๋ก ๋๋ ๋๊ตฌ๋ฅผ ๋ง๋ค๊ณ , ์๋ฏธ ์๋ ๋ง๋จ์ ๋ฐ๊ฒฌํ๋ ๊ณผ์ ์์ ๋ ๋ง์กฑ์ค๋ฌ์ด ๊ฒฝํ์ ์ ๊ณตํ ์ ์๋ ์๋ก์ด ๊ธฐ๋ฅ๋ค์ ๊ฐ๋ฐํ๊ณ ์์ต๋๋ค.
MG AI ML Team ์๊ฐ
ML Team์ ์ฌ์ฉ์๋ค์๊ฒ ๋ ๋์ ๊ฒฝํ์ ์ ๊ณตํ๊ธฐ ์ํด ๋ชจ๋ฐ์ผ๊ณผ ์๋ฒ ํ๊ฒฝ์์ ์์ฐ์ด ์ฒ๋ฆฌ, ์ด๋ฏธ์ง ๋ถ์, ์ถ์ฒ ์์คํ ๋ฑ ๋ค์ํ ๋ถ์ผ์ AI ๊ธฐ์ ์ ์ ๊ทน์ ์ผ๋ก ํ์ฉํ์ฌ ์ฐ๊ตฌ ๊ฐ๋ฐ์ ์งํํฉ๋๋ค.
์ด๋ฅผ ์ํด ํจ๊ป ๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ถ๋ค์ ์ฐพ๊ณ ์์ต๋๋ค.โขย Multi-modal ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ๋ฌธ์ โขย ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ์์ ์์ง๋ ๋ฐ์ดํฐ ๊ฐ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ๋ domain adaptation ๋ฌธ์ โขย Multi-task ํน์ multi-label ๋ถ๋ฅ ๋ชจ๋ธ๋ง์ ๋ํ ๋ฌธ์ โขย ํ ์คํธ ๋ฐ ์ด๋ฏธ์ง ์์ฝ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ๋ํ ๋ฌธ์ โขย ์ถ์ฒ ์์คํ ์์ ๋ฐ์ํ๋ diversity ๋ฐ long-tail ๋ฌธ์ โขย large language models ํน์ vision-language models์ ํ์ฉํ ์๋ก์ด ํผ์ณ ๊ฐ๋ฐ๊ณผ ์ด๋ฅผ ์ํ ๋๊ท๋ชจ ๋ชจ๋ธ ํ์ต, ํ๋ ๋ฐ ์๋น ๋ฌธ์
MG AI์์๋ ์ ํ์ ํฌํจ๋๋ AI ๊ธฐ์ ์ ์ฐ๊ตฌํ๊ธฐ ์ํ ๋ ธ๋ ฅ๋ค๋ ๊พธ์คํ ์งํํ๊ณ ์์ต๋๋ค. ๋ค์ํ prototyping์ ์งํํ์ฌ ๋น ๋ฅด๊ฒ ๊ธฐ์ ์ ์คํ ๊ฐ๋ฅ์ฑ์ ํ๋จํ๊ณ , ์ ํํ ์ดํ ์์คํ ์ ์ง์์ ์ธ ๊ฐ์ ๊ณผ ์ฑ์ฅ์ ์ด๋๋ AI flywheel์ ๊ตฌ์ถํ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ๋ค์ ์ฐพ์๋ผ ์ ์๋ ๋ถ๋ค์ ์ฐพ๊ณ ์์ต๋๋ค.
โข Highly imbalanced ๋๋ noisy label ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒโข ๋ชจ๋ธ ์๊ตฌ์ฌํญ์ด ์ง์์ ์ผ๋ก ๋ณํํ๊ฑฐ๋ ์ด๊ธฐ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ์ํฉ์ ๋์ํ ์ ์๋ meta learning ๋ฐฉ๋ฒโข ๋ชจ๋ฐ์ผ ํ๊ฒฝ์์ ์งง์ latency๋ฅผ ์ ์งํ๋ฉด์๋ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ ๊ฒฝ๋ ๋ชจ๋ธ๊ณผ ์ต์ ํโข Large scale model์ ํ์ตํ๊ณ , ์ค์ ์๋น์ค ํ๊ฒฝ์์ ์ด๋น ์๋ฐฑ ๋๋ ์์ฒ ๊ฐ์ ์ ๋ ฅ์ ์์ ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋๋ก ํ ์ ์๋ modeling, optimization ๋ฐ distillation ๋ฐฉ๋ฒโข ๊ธฐ์กด์ ๋ฐฐํฌ๋ ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๊ฐ์ ํ ์ ์๋ continual/life-long learning ๋ฐฉ๋ฒ
ML Engineer ์๊ฐ
ML Engineer๋ ์ต์ฒจ๋จ์ ๋ชจ๋ธ์ ์ฐ๊ตฌํ๊ณ ๊ฐ์ ํ๋ ๊ณผํ์๋ก์์ ์ฐ๊ตฌ ๋ฅ๋ ฅ๊ณผ, ๋ง๋ค์ด์ง ๋ชจ๋ธ์ ์๊ฐ/๊ณต๊ฐ์ ๋ณต์ก๋๋ฅผ ๊ณ ๋ คํด ์ถ๋ก ์ฑ๋ฅ์ ๊ทนํ์ผ๋ก ๋์ด์ฌ๋ฆฌ๋ ๊ณตํ์๋ก์์ ๊ฐ๋ฐ ๋ฅ๋ ฅ์ด ํ์ํฉ๋๋ค. ์ด๋ฐ ๋ฅ๋ ฅ์ ๋ฐํ์ผ๋ก ์ค์ ์๋น์ค์์ ๊ฒช๋ ๋ฌธ์ ๋ฅผ ๋ฐ๊ฒฌ/์ ์ํ๊ณ , ๋ฌธ์ ํด๊ฒฐ์ ์ํ SotA ๋ชจ๋ธ์ ์ฌํ ๋๋ ๊ฐ๋ฐํ๊ณ , ๋ชจ๋ธ์ ์จ๋๋ฐ์ด์ค ๋ฐ ์๋ฒ ํ๊ฒฝ์ ๋ฐฐํฌํ๊ณ , ์ดํ ๋ชจ๋ํฐ๋งํ๋ฉฐ ์ง์์ ์ผ๋ก ๋ชจ๋ธ์ ๊ฐ์ ํ๋ AI flywheel ์ ๊ตฌ์ถํ๋ ๋ฑ ๋ค์ํ ์ ๋ฌด๋ฅผ ์ํํฉ๋๋ค. ์ด ๊ณผ์ ์์ ๋ฐฑ์๋/ํ๋ก ํธ์๋/DevOps ์์ง๋์ด, ๋ฐ์ดํฐ ๋ถ์๊ฐ, PM ๋ฑ ๋ค์ํ ์ ๋ฌธ์กฐ์ง๊ณผ ์ ๊ทน์ ์ผ๋ก ํ์ ํ๋ฉฐ ๋์์ ๋ฐ์ต๋๋ค.
์ผํ๋ ๋ชจ์ต์ ๋ํ ์กฐ๊ธ ๋ ์์ธํ ์ด์ผ๊ธฐ๋ ๋ค์์ ๋ด์ฉ์ ์ฐธ๊ณ ํ์๋ฉด ์ข์ต๋๋ค.โขย AI in Social Discovery(Blending Research and Production)โขย [How AI Lab Works] Head of AI - Shurain ์ธํฐ๋ทฐ
์ฐ๊ตฌ์ ๊ฒฐ๊ณผ๋ฌผ์ ์ ๋ฆฌํ์ฌ ๋ ผ๋ฌธ ํน์ ์ฝ๋๋ก ๊ณต๊ฐํ๋ ๊ฒ ๋ํ ํ ๋ชฉํ ์ค ํ๋์ ๋๋ค. ์ ํ์ ์ฌ์ฉํ๊ธฐ ์ํ ๋ชฉ์ ์ผ๋ก ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ง๋ค๋ค ๋ณด๋ฉด, ๊ธฐ์กด ์ฐ๊ตฌ๋ก๋ ๋ถ์กฑํ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ถ์กฑํ ๋ถ๋ถ์ ์ฑ์ฐ๊ธฐ ์ํด ์งํ๋ ์ฐ๊ตฌ์ ๊ฒฐ๊ณผ๋ฌผ์ ํ๋ก์ ํธ ์ฐธ์ฌ์๋ค์ด ๋ชจ๋ ํจ๊ป ํ์ ํ์ฌ ์ฐ๊ตฌ์ ์๋ฏธ ์๋ ๋ถ๋ถ์ ์ ๋ํ๊ณ ๊ฐ๋ฅํ๋ค๋ฉด ์ฝ๋์ ํจ๊ป ๊ณต๊ฐํฉ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์ง๊ธ๊น์ง ์๋์ ๊ฐ์ ๋์ธ์ ์ฐ๊ตฌ ์ฑ๊ณผ๋ฅผ ๊ฑฐ๋ ์ ์์์ต๋๋ค.- 2024๋ CUPID: 1:1 ์์ ๋์ค์ปค๋ฒ๋ฆฌ ํ๋ซํผ์ ์ํ ์ค์๊ฐ ์ธ์ ๊ธฐ๋ฐ ์ํธ ์ถ์ฒ ์์คํ ICDM Workshop ๋ฐํ- 2023๋ TiDAL: ํจ์จ์ ์ธ ํ์ต ๊ณผ์ ์ ๋ชจ๋ธ ํ๋์ ๊ธฐ๋ฐํ ์กํฐ๋ธ ๋ฌ๋ ๊ธฐ๋ฒ ICCV 2023 ๊ฒ์ฌ- 2023๋ ๋ชจ๋๋ ์ด์ ํ๊ฒฝ์์ ์ฌ๋ฌ ๋ถ๋ฅ ๊ธฐ์ค์ ๋์์ ๋ง์กฑํ๊ธฐ ์ํ ๋ฌธํฑ๊ฐ์ ์ก๋ ์ฐ๊ตฌ WSDM 2023 ๊ฒ์ฌ- 2022๋ ๋ํ ์์ฑ์์์ ์๋ฏธ์ ๋ค์์ฑ์ ๋์ด๋ ์ฐ๊ตฌ EMNLP 2022 ๊ฒ์ฌ- 2022๋ ๋ ์ด๋ธ ๋ ธ์ด์ฆ๊ฐ ์ฌํ ํ๊ฒฝ์์ ํจ๊ณผ์ ์ผ๋ก ํ์ตํ๋ ๋ฐฉ๋ฒ ECCV 2022 ๊ฒ์ฌ- 2022๋ ํ๊น ์บ๋ฆญํฐ์ ๋ช๊ฐ์ง ๋ฐํ๋ง์ ์ด์ฉํ์ฌ ํ๊น ์บ๋ฆญํฐ๋ฅผ ๋ชจ๋ฐฉํ๋ ์ฑ๋ด์ฐ๊ตฌ NAACL 2022 ๊ฒ์ฌ- 2022๋ ๋ํ ์์ฑ ๋ชจ๋ธ์์ ์์๋ฅผ ํ์ฉํ์ฌ ์ฑ๋ฅ์ ๋์ด๋ ์ฐ๊ตฌ ACL 2022 Workshop ๋ฐํ- 2022๋ ๋ชจ๋ฐ์ผ ํ๊ฒฝ์์ ์ค๋์ค ๋ถ๋ฅ๋ฅผ ์ํ distillation ๊ธฐ์ ์ฐ๊ตฌ ICASSP ๊ฒ์ฌ- 2021๋ ํด๋ฆญ๋ฅ ์์ธก์ ์ํ ์ค์๋ ๋ณด์กด์ด ๊ฐ๋ฅํ ํผ์ณ ์ ๊ทํ ์ฐ๊ตฌ ICDM Workshop Best Paper ์์- 2021๋ ย Tabular Learning ๊ธฐ๋ฐ ํจ์จ์ ์ธ Click-Through Rate Prediction ๋ชจ๋ธ ICLR 2021 Workshop ๋ฐํ- 2021๋ ย ํจ์จ์ ์ธ Retriever๊ธฐ๋ฐ Chatbot์ ์ํ Large-Scale Generative ๋ชจ๋ธ ํ์ฉ ์ฐ๊ตฌ EMNLP 2021 ๊ฒ์ฌ- 2020๋ Long-tailed Visual Recognition ๋ฌธ์ ๋ฅผ Label distribution shift ๊ด์ ์์ ํด๊ฒฐํ๋ ๊ธฐ์ CVPR 2021 ๊ฒ์ฌ- 2020๋ ย ํจ์ท ๋ฌ๋์ ํตํ Text-to-Speech(TTS) ๊ธฐ์ INTERSPEECH 2020 ๊ฒ์ฌ- 2019๋ ย ํจ์ท ๋ฌ๋์ ํตํ ์๋ฉด ์ฌํ ๊ธฐ์ AAAI 2020 ๊ฒ์ฌ- 2019๋ ย ๋ชจ๋ฐ์ผ์์ ๋น ๋ฅด๊ฒ ๋์ํ๋ ํค์๋ ์คํํ ๋ชจ๋ธ(TC-ResNet) INTERSPEECH 2019 ๊ฒ์ฌ- 2019๋ ย ๋ชจ๋ฐ์ผ ํ๊ฒฝ์ ์ต์ ํ๋ ๊ฒฝ๋ ์ด๋ฏธ์ง ์ธ๊ทธ๋ฉํ ์ด์ ๋ชจ๋ธ(MMNet) ์์นด์ด๋ธ ์ ๋ก๋- 2018๋ ์ ์ ๋ ฅ ์ด๋ฏธ์ง ์ธ์ ๋ํ(LPIRC) 2๋ฑ
ML ์ฐ๊ตฌ๊ฐ ์ ์งํ๋๊ธฐ ์ํด์๋ ๋ฅ๋ฌ๋ ํ์ต์ ์ํ ์ธํ๋ผ๋ ์ ๊ฐ์ถ์ด์ ธ์ผํฉ๋๋ค. ํ์ดํผ์ปค๋ฅํธ์์๋ ML Engineer๋ค์ด ์ถฉ๋ถํ ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ์คํ์ ์งํํ ์ ์๋๋ก ์์ฒด์ ์ธ ๋ฅ๋ฌ๋ ์ฐ๊ตฌ์ฉ ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ถํ์ฌ ํ์ฉํ๊ณ ์์ต๋๋ค. DGX-A100 20๋๋ก ๊ตฌ์ฑ๋ ํด๋ฌ์คํฐ(์ด 160๋์ A100 GPU)๋ฅผ ์ฌ์ฉํ ์ ์์ผ๋ฉฐ,๋ฅผ ํฌํจํ ๋ค์ํ on-premise ์ฅ๋น๋ค์ ์ฐ๊ตฌ๊ฐ๋ฐ์ ํ์ฉํ ์ ์์ต๋๋ค. ์ถ๊ฐ์ ์ผ๋ก, ๋ฐ์ดํฐ ์์ง, ์ ์ฒ๋ฆฌ๋ฅผ ํฌํจํ ์์ฒด์ ์ธ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ํด๋ผ์ฐ๋ ์๋น์ค๋ฅผ ํ์ฉํ์ฌ ๊ตฌ์ถ ๋ฐ ์ด์ํ๊ณ ์์ต๋๋ค. ๋, ML ๋ชจ๋ธ์ ์ ํํ๋ฅผ ๋์์ฃผ์ค ๋ค์ํ ์ํํธ์จ์ด ์์ง๋์ด (๋ฐฑ์๋/ํ๋ก ํธ์๋/DevOps/MLSE)๋ถ๋ค๊ณผ ํจ๊ป ์ผํ๊ณ ์์ต๋๋ค.
#HPCNT
MG AI๋ ํ์ดํผ์ปค๋ฅํธ์ AI ๊ธฐ์ ์ ํ์ฉํ์ฌ Tinder, Hinge๋ฅผ ๋น๋กฏํ ๋งค์น๊ทธ๋ฃน์ ๋ค์ํ ์ ํ์ ๊ธฐ์ฌํ๊ณ ์์ต๋๋ค. ๋ํ ๊ธฐ์กด์ ๊ธฐ์ ๋ก๋ ์ ๊ทผํ๊ธฐ ์ด๋ ต์ง๋ง ๋จธ์ ๋ฌ๋ ๊ธฐ์ ์ ํตํด ํ ์ ์๋ ๋ฌธ์ ๋ค์ ์ฐพ์๋ด๊ณ ํด๊ฒฐํ์ฌ ์ฌ์ฉ์ ๊ฒฝํ์ ํ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ฌ์ฉ์๋ค์ด ์์ ์ ๋ ์ ํํํ ์ ์๋๋ก ๋๋ ๋๊ตฌ๋ฅผ ๋ง๋ค๊ณ , ์๋ฏธ ์๋ ๋ง๋จ์ ๋ฐ๊ฒฌํ๋ ๊ณผ์ ์์ ๋ ๋ง์กฑ์ค๋ฌ์ด ๊ฒฝํ์ ์ ๊ณตํ ์ ์๋ ์๋ก์ด ๊ธฐ๋ฅ๋ค์ ๊ฐ๋ฐํ๊ณ ์์ต๋๋ค.
MG AI ML Team ์๊ฐ
ML Team์ ์ฌ์ฉ์๋ค์๊ฒ ๋ ๋์ ๊ฒฝํ์ ์ ๊ณตํ๊ธฐ ์ํด ๋ชจ๋ฐ์ผ๊ณผ ์๋ฒ ํ๊ฒฝ์์ ์์ฐ์ด ์ฒ๋ฆฌ, ์ด๋ฏธ์ง ๋ถ์, ์ถ์ฒ ์์คํ ๋ฑ ๋ค์ํ ๋ถ์ผ์ AI ๊ธฐ์ ์ ์ ๊ทน์ ์ผ๋ก ํ์ฉํ์ฌ ์ฐ๊ตฌ ๊ฐ๋ฐ์ ์งํํฉ๋๋ค.
์ด๋ฅผ ์ํด ํจ๊ป ๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ๋ถ๋ค์ ์ฐพ๊ณ ์์ต๋๋ค.โขย Multi-modal ๋ฐ์ดํฐ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ฉํ๋ ๋ฌธ์ โขย ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ์์ ์์ง๋ ๋ฐ์ดํฐ ๊ฐ ์ฐจ์ด๋ฅผ ๊ทน๋ณตํ๋ domain adaptation ๋ฌธ์ โขย Multi-task ํน์ multi-label ๋ถ๋ฅ ๋ชจ๋ธ๋ง์ ๋ํ ๋ฌธ์ โขย ํ ์คํธ ๋ฐ ์ด๋ฏธ์ง ์์ฝ๊ณผ ํ๊ฐ ๋ฐฉ๋ฒ์ ๋ํ ๋ฌธ์ โขย ์ถ์ฒ ์์คํ ์์ ๋ฐ์ํ๋ diversity ๋ฐ long-tail ๋ฌธ์ โขย large language models ํน์ vision-language models์ ํ์ฉํ ์๋ก์ด ํผ์ณ ๊ฐ๋ฐ๊ณผ ์ด๋ฅผ ์ํ ๋๊ท๋ชจ ๋ชจ๋ธ ํ์ต, ํ๋ ๋ฐ ์๋น ๋ฌธ์
MG AI์์๋ ์ ํ์ ํฌํจ๋๋ AI ๊ธฐ์ ์ ์ฐ๊ตฌํ๊ธฐ ์ํ ๋ ธ๋ ฅ๋ค๋ ๊พธ์คํ ์งํํ๊ณ ์์ต๋๋ค. ๋ค์ํ prototyping์ ์งํํ์ฌ ๋น ๋ฅด๊ฒ ๊ธฐ์ ์ ์คํ ๊ฐ๋ฅ์ฑ์ ํ๋จํ๊ณ , ์ ํํ ์ดํ ์์คํ ์ ์ง์์ ์ธ ๊ฐ์ ๊ณผ ์ฑ์ฅ์ ์ด๋๋ AI flywheel์ ๊ตฌ์ถํ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ๋ฒ๋ค์ ์ฐพ์๋ผ ์ ์๋ ๋ถ๋ค์ ์ฐพ๊ณ ์์ต๋๋ค.
โข Highly imbalanced ๋๋ noisy label ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐฉ๋ฒโข ๋ชจ๋ธ ์๊ตฌ์ฌํญ์ด ์ง์์ ์ผ๋ก ๋ณํํ๊ฑฐ๋ ์ด๊ธฐ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ์ํฉ์ ๋์ํ ์ ์๋ meta learning ๋ฐฉ๋ฒโข ๋ชจ๋ฐ์ผ ํ๊ฒฝ์์ ์งง์ latency๋ฅผ ์ ์งํ๋ฉด์๋ ๋์ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ ๊ฒฝ๋ ๋ชจ๋ธ๊ณผ ์ต์ ํโข Large scale model์ ํ์ตํ๊ณ , ์ค์ ์๋น์ค ํ๊ฒฝ์์ ์ด๋น ์๋ฐฑ ๋๋ ์์ฒ ๊ฐ์ ์ ๋ ฅ์ ์์ ์ ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋๋ก ํ ์ ์๋ modeling, optimization ๋ฐ distillation ๋ฐฉ๋ฒโข ๊ธฐ์กด์ ๋ฐฐํฌ๋ ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๊ฐ์ ํ ์ ์๋ continual/life-long learning ๋ฐฉ๋ฒ
ML Engineer ์๊ฐ
ML Engineer๋ ์ต์ฒจ๋จ์ ๋ชจ๋ธ์ ์ฐ๊ตฌํ๊ณ ๊ฐ์ ํ๋ ๊ณผํ์๋ก์์ ์ฐ๊ตฌ ๋ฅ๋ ฅ๊ณผ, ๋ง๋ค์ด์ง ๋ชจ๋ธ์ ์๊ฐ/๊ณต๊ฐ์ ๋ณต์ก๋๋ฅผ ๊ณ ๋ คํด ์ถ๋ก ์ฑ๋ฅ์ ๊ทนํ์ผ๋ก ๋์ด์ฌ๋ฆฌ๋ ๊ณตํ์๋ก์์ ๊ฐ๋ฐ ๋ฅ๋ ฅ์ด ํ์ํฉ๋๋ค. ์ด๋ฐ ๋ฅ๋ ฅ์ ๋ฐํ์ผ๋ก ์ค์ ์๋น์ค์์ ๊ฒช๋ ๋ฌธ์ ๋ฅผ ๋ฐ๊ฒฌ/์ ์ํ๊ณ , ๋ฌธ์ ํด๊ฒฐ์ ์ํ SotA ๋ชจ๋ธ์ ์ฌํ ๋๋ ๊ฐ๋ฐํ๊ณ , ๋ชจ๋ธ์ ์จ๋๋ฐ์ด์ค ๋ฐ ์๋ฒ ํ๊ฒฝ์ ๋ฐฐํฌํ๊ณ , ์ดํ ๋ชจ๋ํฐ๋งํ๋ฉฐ ์ง์์ ์ผ๋ก ๋ชจ๋ธ์ ๊ฐ์ ํ๋ AI flywheel ์ ๊ตฌ์ถํ๋ ๋ฑ ๋ค์ํ ์ ๋ฌด๋ฅผ ์ํํฉ๋๋ค. ์ด ๊ณผ์ ์์ ๋ฐฑ์๋/ํ๋ก ํธ์๋/DevOps ์์ง๋์ด, ๋ฐ์ดํฐ ๋ถ์๊ฐ, PM ๋ฑ ๋ค์ํ ์ ๋ฌธ์กฐ์ง๊ณผ ์ ๊ทน์ ์ผ๋ก ํ์ ํ๋ฉฐ ๋์์ ๋ฐ์ต๋๋ค.
์ผํ๋ ๋ชจ์ต์ ๋ํ ์กฐ๊ธ ๋ ์์ธํ ์ด์ผ๊ธฐ๋ ๋ค์์ ๋ด์ฉ์ ์ฐธ๊ณ ํ์๋ฉด ์ข์ต๋๋ค.โขย AI in Social Discovery(Blending Research and Production)โขย [How AI Lab Works] Head of AI - Shurain ์ธํฐ๋ทฐ
์ฐ๊ตฌ์ ๊ฒฐ๊ณผ๋ฌผ์ ์ ๋ฆฌํ์ฌ ๋ ผ๋ฌธ ํน์ ์ฝ๋๋ก ๊ณต๊ฐํ๋ ๊ฒ ๋ํ ํ ๋ชฉํ ์ค ํ๋์ ๋๋ค. ์ ํ์ ์ฌ์ฉํ๊ธฐ ์ํ ๋ชฉ์ ์ผ๋ก ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ง๋ค๋ค ๋ณด๋ฉด, ๊ธฐ์กด ์ฐ๊ตฌ๋ก๋ ๋ถ์กฑํ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ถ์กฑํ ๋ถ๋ถ์ ์ฑ์ฐ๊ธฐ ์ํด ์งํ๋ ์ฐ๊ตฌ์ ๊ฒฐ๊ณผ๋ฌผ์ ํ๋ก์ ํธ ์ฐธ์ฌ์๋ค์ด ๋ชจ๋ ํจ๊ป ํ์ ํ์ฌ ์ฐ๊ตฌ์ ์๋ฏธ ์๋ ๋ถ๋ถ์ ์ ๋ํ๊ณ ๊ฐ๋ฅํ๋ค๋ฉด ์ฝ๋์ ํจ๊ป ๊ณต๊ฐํฉ๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, ์ง๊ธ๊น์ง ์๋์ ๊ฐ์ ๋์ธ์ ์ฐ๊ตฌ ์ฑ๊ณผ๋ฅผ ๊ฑฐ๋ ์ ์์์ต๋๋ค.- 2024๋ CUPID: 1:1 ์์ ๋์ค์ปค๋ฒ๋ฆฌ ํ๋ซํผ์ ์ํ ์ค์๊ฐ ์ธ์ ๊ธฐ๋ฐ ์ํธ ์ถ์ฒ ์์คํ ICDM Workshop ๋ฐํ- 2023๋ TiDAL: ํจ์จ์ ์ธ ํ์ต ๊ณผ์ ์ ๋ชจ๋ธ ํ๋์ ๊ธฐ๋ฐํ ์กํฐ๋ธ ๋ฌ๋ ๊ธฐ๋ฒ ICCV 2023 ๊ฒ์ฌ- 2023๋ ๋ชจ๋๋ ์ด์ ํ๊ฒฝ์์ ์ฌ๋ฌ ๋ถ๋ฅ ๊ธฐ์ค์ ๋์์ ๋ง์กฑํ๊ธฐ ์ํ ๋ฌธํฑ๊ฐ์ ์ก๋ ์ฐ๊ตฌ WSDM 2023 ๊ฒ์ฌ- 2022๋ ๋ํ ์์ฑ์์์ ์๋ฏธ์ ๋ค์์ฑ์ ๋์ด๋ ์ฐ๊ตฌ EMNLP 2022 ๊ฒ์ฌ- 2022๋ ๋ ์ด๋ธ ๋ ธ์ด์ฆ๊ฐ ์ฌํ ํ๊ฒฝ์์ ํจ๊ณผ์ ์ผ๋ก ํ์ตํ๋ ๋ฐฉ๋ฒ ECCV 2022 ๊ฒ์ฌ- 2022๋ ํ๊น ์บ๋ฆญํฐ์ ๋ช๊ฐ์ง ๋ฐํ๋ง์ ์ด์ฉํ์ฌ ํ๊น ์บ๋ฆญํฐ๋ฅผ ๋ชจ๋ฐฉํ๋ ์ฑ๋ด์ฐ๊ตฌ NAACL 2022 ๊ฒ์ฌ- 2022๋ ๋ํ ์์ฑ ๋ชจ๋ธ์์ ์์๋ฅผ ํ์ฉํ์ฌ ์ฑ๋ฅ์ ๋์ด๋ ์ฐ๊ตฌ ACL 2022 Workshop ๋ฐํ- 2022๋ ๋ชจ๋ฐ์ผ ํ๊ฒฝ์์ ์ค๋์ค ๋ถ๋ฅ๋ฅผ ์ํ distillation ๊ธฐ์ ์ฐ๊ตฌ ICASSP ๊ฒ์ฌ- 2021๋ ํด๋ฆญ๋ฅ ์์ธก์ ์ํ ์ค์๋ ๋ณด์กด์ด ๊ฐ๋ฅํ ํผ์ณ ์ ๊ทํ ์ฐ๊ตฌ ICDM Workshop Best Paper ์์- 2021๋ ย Tabular Learning ๊ธฐ๋ฐ ํจ์จ์ ์ธ Click-Through Rate Prediction ๋ชจ๋ธ ICLR 2021 Workshop ๋ฐํ- 2021๋ ย ํจ์จ์ ์ธ Retriever๊ธฐ๋ฐ Chatbot์ ์ํ Large-Scale Generative ๋ชจ๋ธ ํ์ฉ ์ฐ๊ตฌ EMNLP 2021 ๊ฒ์ฌ- 2020๋ Long-tailed Visual Recognition ๋ฌธ์ ๋ฅผ Label distribution shift ๊ด์ ์์ ํด๊ฒฐํ๋ ๊ธฐ์ CVPR 2021 ๊ฒ์ฌ- 2020๋ ย ํจ์ท ๋ฌ๋์ ํตํ Text-to-Speech(TTS) ๊ธฐ์ INTERSPEECH 2020 ๊ฒ์ฌ- 2019๋ ย ํจ์ท ๋ฌ๋์ ํตํ ์๋ฉด ์ฌํ ๊ธฐ์ AAAI 2020 ๊ฒ์ฌ- 2019๋ ย ๋ชจ๋ฐ์ผ์์ ๋น ๋ฅด๊ฒ ๋์ํ๋ ํค์๋ ์คํํ ๋ชจ๋ธ(TC-ResNet) INTERSPEECH 2019 ๊ฒ์ฌ- 2019๋ ย ๋ชจ๋ฐ์ผ ํ๊ฒฝ์ ์ต์ ํ๋ ๊ฒฝ๋ ์ด๋ฏธ์ง ์ธ๊ทธ๋ฉํ ์ด์ ๋ชจ๋ธ(MMNet) ์์นด์ด๋ธ ์ ๋ก๋- 2018๋ ์ ์ ๋ ฅ ์ด๋ฏธ์ง ์ธ์ ๋ํ(LPIRC) 2๋ฑ
ML ์ฐ๊ตฌ๊ฐ ์ ์งํ๋๊ธฐ ์ํด์๋ ๋ฅ๋ฌ๋ ํ์ต์ ์ํ ์ธํ๋ผ๋ ์ ๊ฐ์ถ์ด์ ธ์ผํฉ๋๋ค. ํ์ดํผ์ปค๋ฅํธ์์๋ ML Engineer๋ค์ด ์ถฉ๋ถํ ๋ชจ๋ธ ๊ฐ๋ฐ ๋ฐ ์คํ์ ์งํํ ์ ์๋๋ก ์์ฒด์ ์ธ ๋ฅ๋ฌ๋ ์ฐ๊ตฌ์ฉ ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ถํ์ฌ ํ์ฉํ๊ณ ์์ต๋๋ค. DGX-A100 20๋๋ก ๊ตฌ์ฑ๋ ํด๋ฌ์คํฐ(์ด 160๋์ A100 GPU)๋ฅผ ์ฌ์ฉํ ์ ์์ผ๋ฉฐ,๋ฅผ ํฌํจํ ๋ค์ํ on-premise ์ฅ๋น๋ค์ ์ฐ๊ตฌ๊ฐ๋ฐ์ ํ์ฉํ ์ ์์ต๋๋ค. ์ถ๊ฐ์ ์ผ๋ก, ๋ฐ์ดํฐ ์์ง, ์ ์ฒ๋ฆฌ๋ฅผ ํฌํจํ ์์ฒด์ ์ธ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ํด๋ผ์ฐ๋ ์๋น์ค๋ฅผ ํ์ฉํ์ฌ ๊ตฌ์ถ ๋ฐ ์ด์ํ๊ณ ์์ต๋๋ค. ๋, ML ๋ชจ๋ธ์ ์ ํํ๋ฅผ ๋์์ฃผ์ค ๋ค์ํ ์ํํธ์จ์ด ์์ง๋์ด (๋ฐฑ์๋/ํ๋ก ํธ์๋/DevOps/MLSE)๋ถ๋ค๊ณผ ํจ๊ป ์ผํ๊ณ ์์ต๋๋ค.
Required Qualifications
- AI/ML์ ๋ํ ๊ธฐ๋ณธ ์ง์๊ณผ ์ ์ด๋ ํ ๊ฐ ์ด์์ ํน์ ๋๋ฉ์ธ์ ๋ํ ๊น์ด ์๋ ์ง์์ ๊ฐ์ถ๊ณ , ๊ด๋ จ ํ๋ก์ ํธ ๊ฒฝํ์ด ์์ผ์ ๋ถ
- AI ๊ธฐ์ ์ ์๋น์คํ์ ๊ด์ฌ์ด ๋ง์ผ์ ๋ถ
- Tensorflow, PyTorch, CatBoost, JAX ๋ฑ ์คํ์์ค ํ๋ ์์ํฌ ๊ธฐ๋ฐ ๊ฐ๋ฐ์ญ๋์ ํฌํจํ ํ์ด์ฌ ๊ฐ๋ฐ์ญ๋์ด ์ถฉ๋ถํ์ ๋ถ
- ML ๋ชจ๋ธ์ ํ์ตํ๊ณ ์๋น์ค์ ๋ฐฐํฌํ๊ธฐ๊น์ง ํ์ํ ์์ง๋์ด๋ง ์ญ๋์ ๊ฐ์ถ์ ๋ถ
- Exploratory Data Analysis(EDA)๋ฅผ ํตํด, ๋ฐ์ดํฐ์ ํต๊ณ์ ํน์ฑ๊ณผ ํจํด์ ๋ฐ๊ฒฌํ๊ณ ์ด๋ฅผ ML ๋ชจ๋ธ์ ๋ฐ์ํ์ค ์ ์๋ ๋ถ
- ๊ตฌํ์ฒด๊ฐ ๊ณต๊ฐ๋์ง ์์ ๋ ผ๋ฌธ์ ์ฝ๊ณ ์ด๋ฅผ ๋น ๋ฅด๊ณ ์ ํํ๊ฒ ๊ตฌํํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ์ ๋ถ
- ๊ณต๊ฐ๋ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ ์ ์ ์ด์ฉํด ๋ชจ๋ธ์ ํ ์คํธ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๊ธฐ ์ํด ์ฌ๋ฌ ๊ฐ์ง ๋ชจ๋ธ๋ง์ ํด๋ณธ ๊ฒฝํ์ด ์์ผ์ ๋ถ
- ํ์๋ ๊ตญ์ ์ ๋ฌด๊ดํ๋ ํ๊ตญ์ด๋ก ์ํํ ์์ฌ์ํต์ด ๊ฐ๋ฅํ ๋ถ
Preferred Qualifications
- ๊ธฐ๊ณํ์ต ๊ด๋ จ ํํฐ์ด ํํ ๋ฐ ์ ๋ (NeurIPS, ICLR, ICML, CVPR, ICCV/ECCV, KDD ๋ฑ) ๊ฒ์ฌ ์ค์ ํน์ AI ๊ด๋ จ ๋ํ ์์ ์ค์ ์ด ์์ผ์ ๋ถ
- AI/ML ๋๋ฉ์ธ ์ ๋ฐ์ ๋ํ ์ดํด๋ฅผ ๊ฐ์ถ์ ๋ถ
- ์ค์ ์๋น์ค์ AI ๊ธฐ์ ์ ํตํฉํ๊ณ ์ฃผ์ ์งํ๋ฅผ ์ ์๋ฏธํ๊ฒ ํฅ์์์ผ ๋ณธ ๊ฒฝํ์ด ์์ผ์ ๋ถ
- ๊ธฐ๊ณํ์ต ๊ด๋ จ ์คํ ์์ค ๊ฐ๋ฐ์ ์ฐธ์ฌํด ๋ณธ ๊ฒฝํ์ด ์์ผ์ ๋ถ
- ํด๋ผ์ด์ธํธ(Android, iOS), ๋ฐฑ์๋๋ฅผ ํฌํจํด AI/ML ๋ถ์ผ ์ธ ๊ฐ๋ฐ ๊ฒฝํ์ด ํ๋ถํ์ ๋ถ
- A/B ํ ์คํธ ์คํ ๊ธฐํ ๋ฐ ํ๊ฒ KPI ์งํ๋ฅผ ์ ์ํ๊ณ , SQL๊ธฐ๋ฐ ๋ฐ์ดํฐ ๋ถ์์ ์งํํ ๊ฒฝํ์ด ์์ผ์ ๋ถ
- ๋จธ์ ๋ฌ๋ ์ํฌํ๋ก์ฐ์ ์๋ํ ๊ฒฝํ์ด ์์ผ์ ๋ถ (AutoML, hyperparameter optimization, ๋ฐ์ดํฐ ๋ฐ ํ์ต ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ ๋ฑ)
- ์์ด๋ก ์ํํ ์์ฌ์ํต์ด ๊ฐ๋ฅํ์ ๋ถ
Hiring Process
- ๊ณ ์ฉ ํํ: ์ ๊ท์ง
- ์ฑ์ฉ ์ ์ฐจ: ์๋ฅ์ ํ > ์ฝ๋ฉํ ์คํธ/์ฌ์ ๊ณผ์ > 1์ฐจ ๋ฉด์ > Recruiter Call > 2์ฐจ ๋ฉด์ > 3์ฐจ๋ฉด์ (ํด๋น ์) > ์ต์ข ํฉ๊ฒฉ (*์ผ๋ถ ์์๊ฐ ๋ณ๊ฒฝ๋ ์ ์์ต๋๋ค.)
- ์๋ฅ ์ ํ์ ๊ฒฝ์ฐ ํฉ๊ฒฉ์์ ํํ์ฌ ๊ฐ๋ณ ์๋ด๋๋ฆด ์์ ์ ๋๋ค.
- ์ง์ ์๋ฅ: ์์ ์์์ ์์ธ ๊ฒฝ๋ ฅ๊ธฐ๋ฐ ๊ตญ๋ฌธ ๋๋ ์๋ฌธ์ด๋ ฅ์(PDF)
etc
- ํ์ดํผ์ปค๋ฅํธ๋ ์ฆ๋ช ์ฌ์ง, ์ฃผ๋ฏผ๋ฑ๋ก๋ฒํธ, ๊ฐ์กฑ๊ด๊ณ, ํผ์ธ์ฌ๋ถ ๋ฑ ์ฑ์ฉ๊ณผ ๊ด๊ณ์๋ ๊ฐ์ธ์ ๋ณด๋ฅผ ์๊ตฌํ์ง ์์ต๋๋ค.
- ์์ต๊ธฐ๊ฐ ์ค ๊ธ์ฌ ๋ฑ ์ฒ์ฐ์ ์ฐจ๋ฑ์ด ์์ต๋๋ค.
- ์ ์ถํด ์ฃผ์ ๋ด์ฉ ์ค ํ์ ์ฌ์ค์ด ์์ ๊ฒฝ์ฐ ์ฑ์ฉ์ด ์ทจ์๋ ์ ์์ต๋๋ค.
- ํ์ ์ ์ฌ์ ์ ์๋ด๋ ์ฑ์ฉ ์ ์ฐจ ์ธ์๋ ์ถ๊ฐ ๋ฉด์ ์ ํ์ด ์งํ๋ ์ ์์ต๋๋ค.
- ํ์ ์ ์ง์์์ ๋์ ํ์ ํํ์กฐํ ์ ์ฐจ๊ฐ ์งํ๋ ์ ์์ผ๋ฉฐ, ํํ์กฐํ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ์ฑ์ฉ์ด ์ทจ์๋ ์ ์์ต๋๋ค.
- ์ด ํฌ์ง์ ์ ์ฐ์ ๊ธฐ๋ฅ์์ ๋ณด์ถฉ์ญ ํธ์ /์ ์ง, ์ ๋ฌธ์ฐ๊ตฌ์์ ํ์ญ ์ ์ง, ์ ๋ฌธ์ฐ๊ตฌ์์ ๋ณด์ถฉ์ญ ํธ์ /์ ์ง ์ฑ์ฉ์ด ๊ฐ๋ฅํฉ๋๋ค. ๋ณ์ญํน๋ก์์์ ๊ฒฝ์ฐ, ๋ณ์ญํน๋ก ๊ด๋ จ๋ฒ์ ๋ฐ๋ผ ๋ณต๋ฌด๊ด๋ฆฌ๋ฅผ ์งํํฉ๋๋ค. (*์ ๋ฌธ์ฐ๊ตฌ์์ ํ์ญ ์ ๊ทํธ์ ์ย ํ์ฌ ๋ง๊ฐ๋์์ต๋๋ค)
#HPCNT
* Salary range is an estimate based on our AI, ML, Data Science Salary Index ๐ฐ
Job stats:
8
1
0
Categories:
Deep Learning Jobs
Engineering Jobs
Machine Learning Jobs
Tags: Data analysis DevOps EDA EMNLP GPU ICLR ICML JAX LLMs Machine Learning NeurIPS Privacy PyTorch Research ResNet TensorFlow
Region:
Asia/Pacific
Country:
South Korea
More jobs like this
Explore more career opportunities
Find even more open roles below ordered by popularity of job title or skills/products/technologies used.
Data Engineer II jobsSr. Data Engineer jobsBI Developer jobsBusiness Intelligence Developer jobsPrincipal Data Engineer jobsStaff Data Scientist jobsStaff Machine Learning Engineer jobsPrincipal Software Engineer jobsJunior Data Analyst jobsData Science Intern jobsDevOps Engineer jobsData Manager jobsSoftware Engineer II jobsData Science Manager jobsStaff Software Engineer jobsData Analyst Intern jobsLead Data Analyst jobsData Specialist jobsBusiness Data Analyst jobsAI/ML Engineer jobsSr. Data Scientist jobsBusiness Intelligence Analyst jobsData Governance Analyst jobsData Engineer III jobsSenior Backend Engineer jobs
Consulting jobsMLOps jobsAirflow jobsOpen Source jobsEconomics jobsLinux jobsKPIs jobsKafka jobsGitHub jobsTerraform jobsJavaScript jobsPostgreSQL jobsRDBMS jobsData Warehousing jobsPrompt engineering jobsNoSQL jobsStreaming jobsClassification jobsComputer Vision jobsBanking jobsRAG jobsScikit-learn jobsPhysics jobsGoogle Cloud jobsHadoop jobs
dbt jobsPandas jobsGPT jobsBigQuery jobsLooker jobsOracle jobsScala jobsR&D jobsData warehouse jobsReact jobsDistributed Systems jobsLangChain jobsScrum jobsPySpark jobsMicroservices jobsCX jobsELT jobsIndustrial jobsOpenAI jobsSAS jobsRedshift jobsJira jobsModel training jobsTypeScript jobsRobotics jobs