Biography

Chanjun Park is an Assistant Professor in the School of Software at Soongsil University, where he serves as the Principal Investigator of the Natural Language Processing Lab. Prior to joining Soongsil University, he was a Research Professor at Korea University. Before that, he served as a Principal Research Engineer and Technical Leader of the Large Language Models (LLMs) team at Upstage, where he contributed to building an ecosystem for LLMs. He also worked as a Research Engineer at SYSTRAN, contributing to advancements in machine translation (MT) and automatic speech recognition (ASR) systems. He earned his Ph.D. in the Department of Computer Science and Engineering at Korea University under the supervision of Professor Heuiseok Lim. He received the Naver Ph.D. Fellowship and was selected for the Forbes 30 Under 30 Korea. For more details, please see his CV.

Research Interest

My research philosophy is centered on service-driven research, aiming to bridge the gap between foundational theories in natural language processing (NLP) and their real-world applications. My primary interests include the development of efficient, purpose-trained Large Language Models (LLMs), with a focus on exploring their capability landscape across parameter regions and understanding how model scale and architecture shape emergent behaviors. I am also actively investigating how real-world phenomena can be systematically represented as text to enhance reasoning capabilities in LLMs. In addition, I am deeply engaged in cross-lingual NLP and multidisciplinary research that integrates insights from diverse domains to broaden the scope and impact of NLP technologies.

News

2026: I will serve as an Area Chair at EACL 2026.
2025: Seven papers (including three from Findings and one from Industry) have been accepted at EMNLP 2025. Among them, four papers are collaborative works with Korea University, one paper is a collaboration with Chungnam National University, another with Yonsei University, and one represents an industry–academia collaboration with Upstage. Notably, two of these papers were selected for Oral presentations.
2025: Six papers have been accepted to HCLT-KACL 2025, five of which were selected for Oral presentations. Among them, the research received the Best Paper Award and the Outstanding Paper Award at the conference.
2025: I have been selected for the National Foundation Model Project (독자 AI 파운데이션모델 사업, K-AI 사업, 국가대표 LLM 프로젝트). I will be participating as part of the NC AI Consortium, together with Korea University, Seoul National University, Yonsei University, KAIST, ETRI, AIWorks, POSCO DX, Lotte Innovate, HL Robotics, InterX, MediaZen, MBC, and NHN.
2025: Two papers have been accepted at CIKM 2025. This research was conducted in collaboration with the University of Tokyo and MIT.
2025: I will serve as the Academic Chair (학술위원장) of HCLT-KACL 2025.
2025: I will join the Department of Software at Soongsil University as an Assistant Professor starting in September 2025.
2025: I will serve as an Area Chair at EMNLP 2025.
2025: Three papers (including one from SRW) have been accepted at ACL 2025.
2025: I will serve as an Area Chair at ACL 2025.
2025: Nine papers (including three from Findings, three from Industry and one from Demo) have been accepted at NAACL 2025.
2025: Two papers (including one from Industry) have been accepted at COLING 2025.
2024: After 2 years and 9 months at Upstage, I have joined Korea University as a Research Professor.
2024: Five papers (including two from Findings, one from Demo and one from Industry) have been accepted at EMNLP 2024.
2024: Three papers (including two Findings) have been accepted at ACL 2024.
2024: Three papers (including one from industry and two from SRW) have been accepted at NAACL 2024.
2024: Two papers have been accepted at LREC-COLING 2024.
2024: Two papers have been accepted at EACL Findings 2024.
2024: I was selected for Forbes 30 Under 30 Korea.
2024: I was selected to serve as the Publication Chair for DMLR at ICLR 2024.
2024: I was selected to serve as the Program Chair for Widening NLP (WiNLP) Workshop at EMNLP 2024.
2023: Two papers have been accepted at EMNLP 2023.

Education

2019.09 - 2023.08: Ph.D in Computer Science and Engineering, Korea University (Advisor: Heuiseok Lim)
2015.03 - 2019.02: B.S. in Natural Language Processing & Creative Convergence, Busan University of Foreign Studies (BUFS) (Advisor: Pum-mo Ryu)

Work Experiences

2025.09 - Now: Soongsil University, Assistant Professor
2024.12 - 2025.08: Korea University, Research Professor
2022.03 - 2024.11: Upstage, Principal Research Engineer, Technical Leader (TL)
2018.06 - 2019.07: SYSTRAN, Research Engineer

Academic Services

Program Chair (Organizer): Widening NLP (WiNLP) Workshop at EMNLP 2023 & EMNLP 2024
Publication Chair (Organizer): Data-centric Machine Learning Research (DMLR) 2024 at ICLR 2024
Virtual Social Chair (Organizer): COLING 2022
Academic Chair: HCLT-KACL 2025
Area Chair: ACL, EMNLP
Program Committee (Reviewer): ACL, EMNLP, NAACL, EACL, COLING, WMT, ARR, ICML, NeurIPS, ICLR, AAAI

Publications (Selected)

Please see my CV or Google Scholar profiles for the full list.

2025

Mixture-of-Clustered-Experts: Advancing Expert Specialization and Generalization in Instruction Tuning
Sugyeong Eo, Jung Jun Lee, Chanjun Park (✝), Heuiseok Lim (✝)
EMNLP 2025 (Oral)
Benchmark Profiling: Mechanistic Diagnosis of LLM Benchmarks
Dongjun Kim, Gyuho Shim, Yongchan Chun, Minhyuk Kim, Chanjun Park (✝), Heuiseok Lim (✝)
EMNLP 2025 (Oral)
MultiDocFusion : Hierarchical and Multimodal Chunking Pipeline for Enhanced RAG on Long Industrial Documents
Joong Min Shin, Chanjun Park, Jeongbae Park, Jaehyung Seo, Heuiseok Lim
EMNLP 2025
HAWK: Highlighting Entity-aware Knowledge for Alleviating Information Sparsity in Long Contexts
Seonmin Koo, Jinsung Kim, Chanjun Park (✝), Heuiseok Lim (✝)
EMNLP 2025-Findings
ZEBRA: Leveraging Model-Behavioral Knowledge for Zero-Annotation Preference Dataset Construction
Jeesu Jung, Jinsung Kim, Chanjun Park (✝), Sangkeun Jung (✝)
EMNLP 2025-Findings
Can Code-Switched Texts Activate a Knowledge Switch in LLMs? A Case Study on English-Korean Code-Switching
Seoyeon Kim, Huiseo Kim, Chanjun Park, Jinyoung Yeo, Dongha Lee
EMNLP 2025-Findings
LP Data Pipeline: Lightweight, Purpose-driven Data Pipeline for Large Language Models
Yungi Kim, Hyunsoo Ha, Seonghoon Yang, Sukyung Lee, Jihoo Kim, Chanjun Park (✝)
EMNLP 2025-Industry
AGENTiGraph: A Multi-Agent Knowledge Graph Framework for Interactive, Domain-Specific LLM Chatbots
Xinjie Zhao, Moritz Blum, Fan Gao, Yingjian Chen, Boming Yang, Luis Marquez-Carpintero, Mónica Pina-Navarro, Yanran Fu, So Morikawa, Yusuke Iwasawa, Yutaka Matsuo, Chanjun Park, Irene Li
CIKM 2025-Demo
HealthGenie: An Interactive Knowledge-Driven LLM Framework for Tailored Dietary Guidance
Fan Gao, Xinjie Zhao, Ding Xia, Zhongyi Zhou, Rui Yang, Jinghui Lu, Hang Jiang, Chanjun Park, Irene Li
CIKM 2025-Demo
Rethinking KenLM: Good and Bad Model Ensembles for Efficient Text Quality Filtering in Large Web Corpora
Yungi Kim, Hyunsoo Ha, Sukyung Lee, Jihoo Kim, Seonghoon Yang, Chanjun Park (✝)
ACL 2025
Enhancing Automatic Term Extraction in Large Language Models via Syntactic Retrieval
Yongchan Chun, Minhyuk Kim, Dongjun Kim, Chanjun Park (✝), Heuiseok Lim (✝)
ACL 2025-Findings
From Ambiguity to Accuracy: The Transformative Effect of Coreference Resolution on RAG systems
Youngjoon Jang, Seongtae Hong, Junyoung Son, Sungjin Park, Chanjun Park (✝), Heuiseok Lim (✝)
ACL 2025 - Student Research Workshop
LCIRC: A Recurrent Compression Approach for Efficient Long-form Context and Query Dependent Modeling in LLMs
Sumin An, Junyoung Sung, Wonpyo Park, Chanjun Park (✝), Paul Hongsuck Seo (✝)
NAACL 2025 (Oral)
CoME: A Unlearning-based Approach to Conflict-free Model Editing
Dahyun Jung, Jaehyung Seo, Jaewook Lee, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2025
MIRAGE: A Metric-Intensive Benchmark for Retrieval-Augmented Generation Evaluation
Chanhee Park, Hyeonseok Moon, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2025-Findings
FLEX: A Benchmark for Evaluating Robustness of Fairness in Large Language Models
Dahyun Jung, Seungyoon Lee, Hyeonseok Moon, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2025-Findings
Find the Intention of Instruction: Comprehensive Evaluation of Instruction Understanding for Large Language Models
Hyeonseok Moon, Jaehyung Seo, Seungyoon Lee, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2025-Findings
Open Ko-LLM Leaderboard2: Bridging Foundational and Practical Evaluation for Korean LLMs
Hyeonwoo Kim, Dahyun Kim, Jihoo Kim, Sukyung Lee, Yungi Kim, Chanjun Park (✝)
NAACL 2025 - Industry, 2025
Understanding LLM Development Through Longitudinal Study: Insights from the Open Ko-LLM Leaderboard
Chanjun Park (✝), Hyeonwoo Kim
NAACL 2025 - Industry, 2025
CharacterGPT: A Persona Reconstruction Framework for Role-Playing Agents
Jeiyoon Park, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2025 - Industry, 2025
Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models
Hyunbyung Park, Sukyung Lee, Gyoungjin Gim, Yungi Kim, Dahyun Kim, Chanjun Park (✝)
NAACL 2025 - Demo, 2025
Representing the Under-Represented: Cultural and Core Capability Benchmarks for Developing Thai Large Language Models
Dahyun Kim, Sukyung Lee, Yungi Kim, Attapol Rutherford, Chanjun Park (✝)
COLING 2025
sDPO: Don’t Use Your Data All at Once
Dahyun Kim, Yungi Kim, Wonho Song, Hyeonwoo Kim, Yunsu Kim, Sanghoon Kim, Chanjun Park (✝)
COLING 2025 - Industry
An analysis on language transfer of pre-trained language model with cross-lingual post-training
Suhyune Son (*), Chanjun Park (*), Jungseob Lee (*), Midan Shim (*), Chanhee Lee, Yoonna Jang, Jaehyung Seo, Jungwoo Lim, Heuiseok Lim
Expert Systems with Applications, 2025

2024

Where am I? Large Language Models Wandering between Semantics and Structures in Long Contexts
Seonmin Koo, Jinsung Kim, YoungJoon Jang, Chanjun Park (✝), Heuiseok Lim (✝)
EMNLP 2024
Search if you don’t know! Knowledge-Augmented Korean Grammatical Error Correction with Large Language Models
Seonmin Koo, Jinsung Kim, Chanjun Park (✝), Heuiseok Lim (✝)
EMNLP 2024-Findings
Translation of Multifaceted Data without Re-Training of Machine Translation Systems
Hyeonseok Moon, Seungyoon Lee, Seongtae Hong, Seungjun Lee, Chanjun Park , Heuiseok Lim
EMNLP 2024-Findings
SAAS: Solving Ability Amplification Strategy for Enhanced Mathematical Reasoning in Large Language Models
Hyeonwoo Kim, Gyoungjin Gim, Yungi Kim, Jihoo Kim, Byungju Kim, Wonseok Lee, Chanjun Park (✝)
EMNLP 2024 - Industry
Evalverse: Unified and Accessible Library for Large Language Model Evaluation
Jihoo Kim, Wonho Song, Dahyun Kim, Yunsu Kim, Yungi Kim, Chanjun Park (✝)
EMNLP 2024 - Demo
Open Ko-LLM Leaderboard: Evaluating Large Language Models in Korean with Ko-H5 Benchmark
Chanjun Park, Hyeonwoo Kim, Dahyun Kim, SeongHwan Cho, Sanghoon Kim, Sukyung Lee, Yungi Kim, Hwalsuk Lee
ACL 2024
KoCommonGEN v2: A Benchmark for Navigating Korean Commonsense Reasoning Challenges in Large Language Models
Jaehyung Seo, Jaewook Lee, Chanjun Park, SeongTae Hong, Seungjun Lee, Heuiseok Lim
ACL 2024 - Findings
Length-aware Byte Pair Encoding for Mitigating Over-segmentation in Korean Machine Translation
Jungseob Lee, Hyeonseok Moon, Seungjun Lee, Chanjun Park (✝), Sugyeong Eo, Hyunwoong Ko, Jaehyung Seo, Seungyoon Lee, Heuiseok Lim (✝)
ACL 2024 - Findings
SOLAR 10.7B: Scaling Large Language Models with Simple yet Effective Depth Up-Scaling
Sanghoon Kim (*, ✝), Dahyun Kim (*), Chanjun Park (*, ✝), Wonsung Lee (*, ✝), Wonho Song (*), Yunsu Kim (*), Hyeonwoo Kim (*), Yungi Kim, Hyeonju Lee, Jihoo Kim, Changbae Ahn, Seonghoon Yang, Sukyung Lee, Hyunbyung Park, Gyoungjin Gim, Mikyoung Cha, Hwalsuk Lee (✝), Sunghun Kim (✝)
NAACL 2024 - Industry
Exploring Inherent Biases in LLMs within Korean Social Context: A Comparative Analysis of ChatGPT and GPT-4
Seungyoon Lee, Dongjun Kim, Dahyun Jung, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2024 - Student Research Workshop
Explainable CED: A Dataset for Explainable Critical Error Detection in Machine Translation
Dahyun Jung, Sugyeong Eo, Chanjun Park (✝), Heuiseok Lim (✝)
NAACL 2024 - Student Research Workshop
Leveraging Pre-existing Resources for Data-Efficient Counter-Narrative Generation in Korean
Seungyoon Lee, Chanjun Park (✝), DaHyun Jung, Hyeonseok Moon, Jaehyung Seo, Sugyeong Eo, Heuiseok Lim (✝)
LREC-COLING 2024, Oral
Detecting Critical Errors Considering Cross-Cultural Factors in English-Korean Translation
Sugyeong Eo, Jungwoo Lim, Chanjun Park, Hyeonseok Moon, Jaehyung Seo, Heuiseok Lim
LREC-COLING 2024, Oral
Model-Based Data-Centric AI: Bridging the Divide Between Academic Ideals and Industrial Pragmatism
Chanjun Park (*, ✝), Minsoo Khang (*), Dahyun Kim (*)
ICLR 2024 - Data-centric Machine Learning Research (DMLR) Workshop
Hyper-BTS Dataset: Scalability and Enhanced Analysis of Back TranScription (BTS) for ASR Post-Processing
Chanjun Park, Jaehyung Seo, Seolhwa Lee, Junyoung Son, Hyeonseok Moon, Sugyeong Eo, Chanhee Lee, Heuiseok Lim
EACL 2024 - Findings
Generative Interpretation: Toward Human-Like Evaluation for Educational Question-Answer Pair Generation
Hyeonseok Moon, Jaewook Lee, Sugyeong Eo, Chanjun Park, Jaehyung Seo, Heuiseok Lim
EACL 2024 - Findings
Exploiting Hanja-based Resources in Processing Korean Historic Documents written by Common Literati
Hyeonseok Moon, Myunghoon Kang, Jaehyung Seo, Sugyeong Eo, Chanjun Park, Yeongwook Yang, Heuiseok Lim
IEEE Access, 2024

2023

KEBAP: Korean Error Explainable Benchmark Dataset for ASR and Post-processing
Seonmin Koo (*), Chanjun Park (*), Jinsung Kim, Jaehyung Seo, Sugyeong Eo, Hyeonseok Moon, Heuiseok Lim
EMNLP 2023
CHEF in the Language Kitchen: A Generative Data Augmentation Leveraging Korean Morpheme Ingredients
Jaehyung Seo, Hyeonseok Moon, Jaewook Lee, Sugyeong Eo, Chanjun Park, Heuiseok Lim
EMNLP 2023
Proceedings of the Seventh Widening NLP Workshop (WiNLP 2023)
Bonaventure F. P. Dossou, Isidora Tourni, Hatem Haddad, Shaily Bhatt, Fatemehsadat Mireshghallah, Sunipa Dev, Tanvi Anand, Weijia Xu, Atnafu Lambebo Tonja, Alfredo Gomez, Chanjun Park
EMNLP 2023-Widening NLP Workshop
Alternative Speech: Complementary Method to Counter-Narrative for Better Discourse
Seungyoon Lee (*), DaHyun Jung (*), Chanjun Park (*), Seolhwa Lee, Heuiseok Lim
ICDM 2023 - The First Workshop on Data-Centric AI
Synthetic Alone: Exploring the Dark Side of Synthetic Data for Grammatical Error Correction
Chanjun Park (*), Seonmin Koo (*), Seolhwa Lee, Jaehyung Seo, Sugyeong Eo, Hyeonseok Moon, Heuiseok Lim
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
DMOps: Data Management Operation and Recipes
Eujeong Choi, Chanjun Park (*, ✝)
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Inter-Annotator Agreement in the Wild: Uncovering Its Emerging Roles and Considerations in Real-World Scenarios
NamHyeok Kim, Chanjun Park (*, ✝)
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Transcending Traditional Boundaries: Leveraging Inter-Annotator Agreement (IAA) for Enhancing Data Management Operations
Damrin Kim, NamHyeok Kim, Chanjun Park (✝) , Harksoo Kim (✝)
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Data-Driven Approach for Formality-Sensitive Machine Translation: Language-Specific Handling and Synthetic Data Generation
Seugnjun Lee, Hyeonseok Moon, Chanjun Park, Heuiseok Lim
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Toward Practical Automatic Speech Recognition and Post-Processing: a Call for Explainable Error Benchmark Guideline
Seonmin Koo (*), Chanjun Park (*), Jinsung Kim, Jaehyung Seo, Sugyeong Eo, Hyeonseok Moon, Heuiseok Lim
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Knowledge Graph-Augmented Korean Generative Commonsense Reasoning
Dahyun Jung, Jaehyung Seo, Jaewook Lee, Chanjun Park, Heuiseok Lim
ICML 2023 - Data-centric Machine Learning Research (DMLR) Workshop
Informative Evidence-guided Prompt-based Fine-tuning for English-Korean Critical Error Detection
DaHyun Jung, Sugyeong Eo, Chanjun Park, Hyeonseok Moon, Jaehyung Seo, Heuiseok Lim
IJCNLP-AACL 2023
Improving Formality-Sensitive Machine Translation using Data-Centric Approaches and Prompt Engineering
Seugnjun Lee, Hyeonseok Moon, Chanjun Park, Heuiseok Lim
IWSLT 2023
PEEP-Talk: A Situational Dialogue-based Chatbot for English Education
Seugnjun Lee, Yoonna Jang, Chanjun Park, Jungseob Lee, Jaehyung Seo, Hyeonseok Moon, Sugyeong Eo, Seounghoon Lee, Bernardo Nugroho Yahya, Heuiseok Lim
ACL 2023 - Demo
Doubts on the Reliability of Parallel Corpus Filtering
Hyeonseok Moon, Chanjun Park , Seonmin Koo, Jungseob Lee, Seungjun Lee, Jaehyung Seo, Sugyeong Eo, Yoonna Jang, Hyunjoong Kim, Hyoung-gyu Lee, Heuiseok Lim
Expert Systems With Applications, 2023
Uncovering the Risks and Drawbacks Associated with the Use of Synthetic Data for Grammatical Error Correction
Seonmin Koo (*), Chanjun Park (*), Seolhwa Lee, Jaehyung Seo, Sugyeong Eo, Hyeonseok Moon, Heuiseok Lim
IEEE Access, 2023
Data-Centric Neural Machine Translation - A Real-World Approaches
Chanjun Park
Ph.D. Dissertation

Teaching (Selected)

Database Application, Soongsil University. (2025-Fall)

Awards (Selected)

Year	Award
2024.02	Forbes 30 Under 30 Korea
2023.02	Best Paper Award at Korea University
2022.12	1st Place at WMT Quality Estimation Shared Task 2022 - Sentence-level Critical Error Detection
2021.12	Naver Ph.D. Fellowship
2019.10	1st Place at Microsoft AI Accessibility Hackathon in Korea, Microsoft

Media Coverages (Press, Youtube, Blog)

Year	Headline	Press
2026.01	Korea Kicks Off AI Squid Game in Bid to Compete With US, China	Bloomberg
2026.01	“독자 AI, 나사부터 만들자는 거냐” 네이버 모델도 논란	중앙일보
2026.01	국대 AI, 지속되는 ‘모방’ 논란…’프롬 스크래치’가 뭐길래?	머니투데이
2025.11	“GPU는 26만장 샀는데 굴릴 사람은?”… 韓 AI의 ‘5년 승부수’	디지털데일리
2025.11	‘딥시크 이후’ 또 흔드는 중국 AI…키미 K2 씽킹 성능은	연합뉴스
2025.11	숭실대 박찬준 교수, AI·데이터마이닝 세계적 학회에 논문 게재	이데일리 외 다수 언론사
2025.11	숭실대 박찬준 교수, 자연어처리 분야 최고 학술대회 논문 7편 게재	뉴스 1 등 다수 언론사
2025.10	韓 1호 컴퓨터 교육 숭실대… 55년만에 ‘1호 AI 대학 전환’ 이정표	디지털데일리
2025.09	국가대표 이어 ‘특화 AI’ 공모…KT·카카오 재도전?	MTN 뉴스
2025.07	‘챗GPT vs 네이버’ 비교해 봤더니‥누가 더 똑똑할까?	MBC
2025.07	업스테이지, 자체 LLM으로 세계에 ‘K-AI’ 심는다(上)	한스경제
2025.06	아이서티-고려대 HIAI연구원, 영상보안 AI기술 개발 MOU 체결	파이낸셜 리뷰 등 다수 언론사
2025.02	딥시크 쇼크…한국 AI 산업, 위기가 기회될까	경향신문
2025.02	‘D·R·I·F·T’ 덫에 갇힌 한국…이대론 ‘AI 패권시대’ 구경꾼 될판	서울경제
2025.02	국내 기업도 AI 서비스 본격화…’동맹 확장’ 노리는 오픈AI	연합뉴스
2025.02	[차이나 역습] “기술전쟁 본격 대비를…’국가 전략 AI’ 신발끈 묶을 때”	연합뉴스
2024.11	불법 학습 데이터 활용…AI 기업 ‘망조’의 지름길	디지털 데일리
2024.11	주한미국대사관 ‘AI 윤리’ 주제로 한 ‘2024 테크 캠프(TechCamp)’ 성료	매일경제 등 다수 언론사
2024.11	주한미국대사관, 한국서 첫 청년 테크 캠프 연다	조선일보
2024.10	AI편향성 문제 해결나선 국가들…국내 데이터 전처리 기술 주목	디지털 데일리
2024.09	오픈AI, 한국어 포함 14개 언어 AI 평가용 벤치마크 데이터셋 출시	AI TIMES
2024.09	국내 AI 업계 오픈AI ‘스트로베리’ 관전평…”초격차까지는 아니다	디지털 데일리
2024.09	추론하는 법 배웠다…오픈AI ‘o1’ 출시에 국내 업계 반응은	ZDNET
2024.08	딥페이크 확산에…“플랫폼이 삭제하는 법 규정” 한목소리	한겨레
2024.08	NIA·업스테이지, ‘오픈 Ko-LLM 리더보드’ 전면 개편	서울경제 외 다수 언론사
2024.08	AI도 가성비 시대? 대형 언어 모델(LLM)과 대비된다는 SLM의 정체는	조선일보
2024.08	한국어 LLM 리더보드 시즌2 가동…“벤치마크 난도 높여 오버피팅 논란 뚫는다”	전자신문
2024.07	‘말 잘하는 AI’는 LLM 덕분? ‘NLP’도 기억하자!	디지털데일리
2024.06	SAAS - Solving Ability Amplification Strategy for Enhanced Mathematical Reasoning in Large Language Models	Upstage Tech Blog
2024.06	The Ecosystem of LLMs from a Real-World Perspective	Kyungpook National University Youtube
2024.06	한국어 LLM 리더보드 ‘업그레이드’ 추론·산출추론 지표 추가	중앙일보 외 다수 언론사
2024.05	‘S급 데이터 모아와라’…빅테크는 도둑질까지 했다	중앙일보
2024.05	올트먼 “우리 AI 밥 줘야지!” 도둑질도 부른 데이터 전쟁	중앙일보 Plus
2024.05	업스테이지 “성능·실용성 모두 갖춘 LLM 개발이 목표”	데일리안
2024.05	What does it mean to use AI ‘ethically’?	NODESHORE
2024.05	“AI 발전하듯 AI 윤리도 진화해야”…네이버·업스테이지의 공통된 시각	테크 월드
2024.05	격화되는 AI 패권 경쟁 속 안전성 확보 법·제도 `제자리`…”`AI 기본법` 조속히 통과돼야”	디지털 타임스
2024.05	한자리에 모인 AI 관계자들 “안전한 AI 기술과 문화 전파해야	스카이 데일리
2024.05	LLM 비즈니스도 ‘풀스택’을 준비해야 할 때	디지털 데일리
2024.05	국제인공지능윤리협회, AI 윤리 논하는 ‘2024 ASC’ 컨퍼런스 개최	매일경제 외 다수 언론사
2024.05	플리토-업스테이지, 손잡고 AI 언어 데이터 구축 추진	디지털데일리 외 다수 언론사
2024.05	Evalverse: Revolutionizing Large Language Model Evaluation with a Unified, User-Friendly Framework	Hugging Face
2024.05	특정 분야 강점 업스테이지 ‘솔라’, 온디바이스 옷 입는다	디지틀 조선일보
2024.05	Upstage Full-stack LLM Ecosystem	디지털 데일리
2024.05	업스테이지 “솔라, 특정 분야서 ‘GPT4’ 넘을 수 있어”	ZDNET Korea
2024.04	업스테이지, ‘오픈 Ko-LLM 리더보드’ 대대적 개편	전자신문
2024.04	오는 5월 AI Tech 2024 개최…생성형 AI 활용 전략에 ‘집중’	헬로티
2024.04	AI 윤리 신뢰성 포럼’ 출범…참가자는 누구?	이데일리
2024.04	MathGPT: Leveraging Llama 2 to create a platform for highly personalized learning	Meta
2024.04	Evalverse: Revolutionizing Large Language Model Evaluation with a Unified, User-Friendly Framework	Upstage Tech Blog
2024.04	과정 모르는 ‘AI 블랙박스’…해결 아닌 해석 필요한 이유	Tech World News
2024.04	기존 벤치마크 한계 도달…새로운 LLM 평가 수단 속속 등장	AI TIMES
2024.04	네이버의 AI 전쟁, 특수	Fortune Korea
2024.04	야놀자·이든티앤에스, NIA·업스테이지 선정 ‘올해의 한국어 LLM’	연합뉴스 외 다수 언론사
2024.04	Open Source All About Data Processing, Dataverse	Hugging Face
2024.04	Upstage AI Introduces Dataverse for Addressing Challenges in Data Processing for Large Language Models	Marktechpost Media
2024.04	Teaching SOLAR to Shine: How Upstage AI’s sDPO Aligns Language Models with Human Values	Marktechpost Media
2024.04	20대에 180편 썼다…‘AI 논문머신’ 박찬준 이야기 [스토리팩-업스테이지⑤]	디지털 데일리
2024.03	“1000명 ‘레드팀’ 공격 막자”…한국 대표 AI, 맹훈련 나선다	머니 투데이
2024.03	업스테이지 솔라 논문, 자연어 처리 학회 ‘NAACL’ 채택	연합뉴스 외 다수 언론사
2024.03	Story Pack - 박찬준	디지털 데일리 콘텐츠랩
2024.03	데이터 처리에 관한 모든 것, 데이터버스의 오픈 소스	Upstage Tech Blog
2024.03	AI 끝판왕 ‘AGI’ 위한 3박자…전문가들 의견 봤더니	Tech World News
2024.03	업스테이지, 데이터 전처리 메커니즘 ‘데이터버스’ 오픈 소스 공개	AI TIMES
2024.03	이세영 뤼튼 대표 등 AI 전문가 5인, 포브스코리아 ‘30세 미만 30인’ 선정	AI TIMES
2024.03	사임 압박에 소송전까지…’AI 패권’ 두고 쟁탈전	SBS
2024.02	포브스코리아 30세 미만 30인 2024 (5) SCIENCE/SW	Forbes Korea
2024.02	포브스코리아 30세 미만 30인 2024	Forbes Korea
2024.02	Introducing the Open Ko-LLM Leaderboard: Leading the Korean LLM Evaluation Ecosystem	Hugging Face
2024.02	Ko-LLM 리더보드, 5개월간 대성공…확장·전환 통해 실사용 도움 될 것	AI TIMES
2024.01	버티컬 시장에 쏠리는 눈…AI발 M&A 슈퍼사이클 열린다	이투데이
2023.12	과기정통부, 제4회 AI 데이터 활용협의회 개최	아시아투데이 등 다수 언론사
2023.12	서울교육청, 16일 ‘AI·디지털 교육 컨퍼런스’ 개최	이데일리 등 다수 언론사
2023.12	업스테이지 연구진, ‘초거대 언어모델 연구 동향’ 이라는 한국어 LLM 서베이 논문 공개	인공지능 신문
2023.12	구글 건재 보여준 AI ‘제미나이’… 전문가 “GPT-4 능가하진 않아”	문화일보
2023.12	구글 ‘제미나이’로 AI 공세…평가는 “글쎄”	전자신문
2023.12	떠오르는 ‘미스트랄 7B’…‘라마 2’ 이어 한국어 모델 세대교체 주도	AI TIMES
2023.12	LLM 리더보드? 한국에는 ‘Open Ko-LLM’이 있다!	Upstage Youtube
2023.12	한국어 AI 경쟁력을 강화하는 ‘Open Ko-LLM 리더보드’	Upstage Tech Blog
2023.11	논문 쓰는 회사들… AI 기술기업들 유력 저널에 게재	서울신문
2023.11	강화학습법 ‘DPO’, ‘RLHF’ 대안으로 인기…마커AI 1위 탈환	AI TIMES
2023.10	‘글로벌 AI 규범, 민·관이 함께!’… 개인정보위, ‘인공지능 프라이버시 민·관 정책협의회’ 출범	AI TIMES 등 다수 언론사
2023.10	인공지능 자연어처리 세계 최고 기술 기업으로…업스테이지, NLP 최고 권위 EMNLP 2023에 논문 2편 채택	AI TIMES 등 다수 언론사
2023.10	마커AI, 차트를 점령하다…최초 1위는 옴니어스닷AI	AI TIMES
2023.09	NIA, 글로벌 LLM 플랫폼 ‘업스테이지’와 국내 ‘초거대 언어 모델’ 생태계 활성화에 기반 다진다!	인공지능신문
2023.09	한국어 데이터 토큰 1조개 함께 모으자	한겨레
2023.08	기업 맞춤용 챗GPT 쓰세요” 오픈AI 급하게 만든 이 숫자	중앙일보
2023.08	세계 1위 기술 증명…업스테이지에 ‘글로벌’은 도전 아닌 현실	AI TIMES
2023.08	챗GPT 제친 업스테이지 박찬준 리더 “협업이 AI 시장서 성패 가를 것”	이투데이
2023.08	업스테이지, 금융권 특화 생성형AI 접목 노하우 공개한다	뉴시스, 파이낸셜뉴스, 아시아투데이 등 다수 언론사
2023.07	AI시대, 데이터의 시대/박찬준 업스테이지 AI 리서치 엔지니어	서울신문
2023.07	데이터 AI 논문 7건, 세계적 학술지 채택	매일경제
2023.06	업스테이지, 글로벌 머신러닝 AI 학회서 논문 7편 채택	매일경제, 서울경제, 디지털투데이, 이코노믹리뷰 등 30개 이상 언론사
2023.04	Data-Centric AI 관점으로 재해석하는 자연언어처리 기반 History of AI	Upstage Tech Blog
2023.04	DMOps(Data Management Operation and Recipes), 현업에서 데이터 구축하기	Upstage Tech Blog
2023.04	Data-Centric AI와 Real-World	Upstage Tech Blog
2023.04	AI·DATA SUMMIT 2023-Real-World Centric AI	allshow TV Youtube
2022.05	성장성·유연한 조직문화에 반했죠	서울경제