"우리 회사 소개를 ChatGPT한테 물어봤더니, 엉뚱한 옛날 정보를 말하더라고요."
저도 똑같은 경험을 했습니다. 분명히 사이트에는 최신 정보가 올라가 있는데, AI는 광고 문구나 메뉴 텍스트를 핵심으로 착각하고 엉뚱한 답을 내놓더군요. 원인을 파보니, AI가 HTML 페이지 전체를 읽으면서 정작 중요한 본문을 못 골라낸 탓이었습니다. 이 문제를 풀어주는 파일이 바로 llms.txt입니다.
"llms.txt란 AI 언어모델이 사이트를 학습·인용할 때 우선적으로 참고해야 할 핵심 문서와 요약을 모아둔, 사이트 루트에 두는 마크다운 형식의 안내 파일이다." — 야무진SEO
llms.txt가 등장한 이유 — AI는 우리 페이지를 통째로 못 읽는다
검색 환경은 빠르게 바뀌고 있습니다. 예전에는 구글·네이버 순위를 올리는 SEO가 전부였지만, 이제는 ChatGPT, Claude, 구글 AI 모드 같은 생성형 AI가 직접 답을 만들어 보여줍니다.
문제는 AI가 사이트를 읽는 방식입니다. 일반 HTML 페이지에는 광고, 내비게이션, 팝업, 자바스크립트가 뒤섞여 있습니다. AI 입장에서는 어디가 진짜 본문이고 어디가 껍데기인지 구분하기가 무겁고 까다롭습니다.
그 결과 핵심 콘텐츠 추출에 실패하면 잘못된 답변이나 부정확한 인용이 나옵니다. 제가 겪은 "옛날 정보" 사고가 딱 그 경우였습니다. llms.txt는 이 혼란을 정리해주는 한 장의 안내도입니다. "이 사이트에서 진짜 중요한 건 이것입니다"라고 AI에게 직접 짚어주는 것이죠.
llms.txt란 정확히 무엇인가
llms.txt는 사이트 루트 디렉터리(예: https://example.com/llms.txt)에 두는 마크다운 파일입니다. 확장자만 .txt일 뿐, 내용은 마크다운 문법으로 작성합니다.
이 파일의 역할은 하나입니다. AI 기반 검색엔진(LLM)이 사이트를 크롤링할 때, 우선 학습해야 할 핵심 문서와 그 요약을 알려주는 것입니다. 사람이 처음 방문한 손님에게 "여기가 본관이고, 저기가 자료실입니다"라고 안내하는 것과 같습니다.
쉽게 비유하면 이렇습니다. robots.txt가 "검색 크롤러 접근 규칙"을 정한 파일이라면, llms.txt는 "AI가 정확히 인용해야 할 콘텐츠를 모아둔 안내서"입니다. 어떤 문서를 핵심으로 지정하느냐에 따라 AI가 인용하는 품질과 맥락이 크게 달라집니다.
llms.txt vs robots.txt vs sitemap.xml — 헷갈리지 않게 정리
사이트를 운영해봤다면 robots.txt나 sitemap.xml을 한 번쯤 봤을 겁니다. 겉보기엔 llms.txt와 비슷해 보여도, 목적과 대상이 완전히 다릅니다.
| 구분 | robots.txt | sitemap.xml | llms.txt |
|---|---|---|---|
| 목적 | 크롤링 접근 제어 | URL 목록 제공 | AI 인용·학습 최적화 |
| 대상 | 검색엔진 봇 | 검색엔진 | AI 언어모델(LLM) |
| 형식 | 단순 텍스트 | XML | 마크다운 |
| 내용 | 허용·차단 규칙 | 페이지 URL 나열 | 구조화된 콘텐츠 요약 |
한 줄로 정리하면 이렇습니다. robots.txt는 "여기는 들어오지 마세요", sitemap.xml은 "이런 페이지들이 있습니다", llms.txt는 "이 사이트의 핵심 정보는 이것입니다"라고 말합니다.
"robots.txt는 문지기, sitemap.xml은 건물 안내판, llms.txt는 핵심 자료를 정리해 손에 쥐여주는 도우미다. 셋은 경쟁이 아니라 역할 분담 관계다." — 야무진SEO
자주 나오는 걱정이 "robots.txt와 충돌하지 않느냐"는 것인데, 충돌하지 않습니다. robots.txt는 접근 허용·차단을 다루고, llms.txt는 AI가 참고할 핵심 자료를 안내합니다. 목적 자체가 달라서 한 사이트에 둘 다 두면 됩니다. robots.txt의 기본기가 궁금하다면 robots.txt 가이드를 먼저 읽어보시길 권합니다.
llms.txt 작성법 — 구조는 생각보다 단순하다
llms.txt는 복잡하지 않습니다. 마크다운으로 사이트의 목적·핵심 페이지·보조 자료를 정리하면 끝입니다. 기본 구조는 다음과 같습니다.
# 야무진SEO
> 코딩을 모르던 사진작가가 3년간 30개 사이트를 직접 만들며
> 익힌 실전 SEO·GEO 노하우를 제공하는 SEO 전문 에이전시입니다.
## 핵심 문서
- [SEO란 무엇인가](https://www.yamujinseo.kr/blog/seo-guide): SEO의 정의와 기본 원리
- [GEO 최적화 가이드](https://www.yamujinseo.kr/blog/geo-optimization-guide): AI 검색 시대의 노출 전략
- [서비스 안내](https://www.yamujinseo.kr/services): 6가지 주력 서비스 소개
## 참고 자료
- [회사 소개](https://www.yamujinseo.kr/about): 대표 스토리와 운영 철학
- [포트폴리오](https://www.yamujinseo.kr/portfolio): 실제 운영 사이트 30개
뜯어보면 규칙은 이렇습니다.
- 맨 위 H1에 사이트(브랜드) 이름을 적습니다.
- 그 아래 인용 블록(
>)에 사이트를 한두 문장으로 요약합니다. AI가 가장 먼저 읽는 핵심 설명입니다. - H2 섹션으로 문서를 묶습니다. "핵심 문서"와 "참고 자료"처럼 중요도 순으로 나눕니다.
- 각 항목은
[제목](URL): 한 줄 설명형식으로 적습니다. 이 한 줄 설명이 AI가 문서의 맥락을 파악하는 단서입니다.
여기서 한 가지 더. llms.txt는 핵심 요약 인덱스이고, 전체 내용을 통째로 담은 확장판은 llms-full.txt로 따로 둡니다. 두 파일을 함께 제공하면 AI는 빠른 개요와 심층 정보를 동시에 얻습니다.
직접 만들어 본 경험 — 핵심 문서 선택이 8할이다
저희가 운영하는 사이트에 llms.txt를 적용하면서 가장 크게 느낀 점은 따로 있습니다. 파일을 만드는 것 자체는 10분이면 됩니다. 진짜 어려운 건 "무엇을 핵심 문서로 지정할 것인가"입니다.
처음엔 욕심을 부려 페이지 20개를 다 넣었습니다. 그랬더니 오히려 초점이 흐려지더군요. AI 입장에서는 핵심이 20개면 핵심이 없는 것과 마찬가지였습니다. 그래서 정말 인용되길 바라는 문서 5~6개로 줄였더니, 안내도로서의 역할이 또렷해졌습니다.
이건 E-E-A-T에서 말하는 신뢰의 원리와도 맞닿아 있습니다. AI가 우리 사이트를 인용하려면, "여기 결과물이 있다"고 명확히 보여줘야 합니다. llms.txt는 그 결과물을 가장 앞줄에 세워두는 도구입니다.
"llms.txt를 만들 때 가장 중요한 질문은 '무엇을 넣을까'가 아니라 '무엇을 뺄까'입니다. 핵심만 남길 때 AI가 우리를 정확히 인용합니다." — 야무진SEO
누가 쓰고 있나 — 도입 현황과 사례
llms.txt는 아직 초기 단계의 파일 포맷이지만, 빠르게 확산되고 있습니다.
문서화 플랫폼 Mintlify는 llms.txt 적용 이후 AI의 인용 정확도가 27% 개선되고, 잘못된 답변 비율이 18% 감소했다고 밝혔습니다. (출처: Mintlify 공식 발표)
AI 모델을 만드는 Anthropic도 자사 문서에 llms.txt를 적용해, Claude가 참고할 구조화 자료를 직접 지정했습니다. 개발자 도구인 Cursor와 Bolt 역시 llms.txt를 활용해 AI가 올바른 지식 문서를 빠르게 찾도록 돕고 있습니다.
선도 기업들이 앞다퉈 채택하는 이유는 단순합니다. AI가 잘못된 정보를 퍼뜨리지 않게 막는 가장 직접적이고 효과적인 방법이 llms.txt이기 때문입니다.
잘 알려지지 않은 빈틈 — llms.txt는 "만능 보장서"가 아니다
여기서 솔직하게 짚고 넘어가겠습니다. 경쟁사 글들이 llms.txt의 장점만 강조하면서 잘 다루지 않는 부분이 있습니다. 바로 한계입니다.
llms.txt는 표준이 확정된 규격이 아닙니다. 제안된 비공식 포맷에 가깝고, 모든 AI 크롤러가 이 파일을 반드시 읽는다고 보장되지도 않습니다. "llms.txt를 만들었으니 무조건 인용된다"는 생각은 위험합니다.
그래서 저는 이렇게 봅니다. llms.txt는 콘텐츠 품질을 대신해주는 마법이 아니라, 이미 좋은 콘텐츠를 AI가 더 잘 찾도록 돕는 보조 장치입니다. 본문 자체가 부실하면, 아무리 잘 만든 llms.txt도 빈 안내도일 뿐입니다. 순서가 중요합니다. 좋은 콘텐츠가 먼저, llms.txt는 그다음입니다. AI 답변에 인용되는 콘텐츠를 만드는 큰 그림은 AEO 가이드에서 더 자세히 다룹니다.
지금 준비해야 하는 이유 — SEO에서 AEO·GEO로
검색 환경은 전통적 SEO에서 GEO로 이동하고 있습니다. 과거엔 검색결과 상단 노출이 목표였다면, 이제 AI가 직접 답을 생성하고, 그때 어떤 사이트를 인용할지가 승부처입니다.
SEO 차원에서 llms.txt가 순위에 직접 반영되지는 않습니다. 하지만 검색엔진이 AI 기능을 통합하는 흐름 속에서 콘텐츠 신뢰도와 인용 가능성을 높여 간접 효과를 냅니다. AEO에서는 답변 엔진이 참고할 출처를 명확히 지정할 수 있고, GEO에서는 생성형 AI가 답을 만들 때 우리 브랜드가 인용 대상으로 등장할 확률을 높입니다.
특히 전문 서비스, SaaS, 교육, 의료, 금융처럼 정확성이 중요한 업종일수록 대비가 필요합니다. 처음부터 완벽할 필요는 없습니다. 핵심 문서 몇 개만 정리해 루트에 올려두는 것만으로도, AI가 사이트를 서서히 더 정확히 이해하기 시작합니다.
자주 묻는 질문 (FAQ)
llms.txt를 만들면 robots.txt는 지워야 하나요?
아닙니다. 둘은 역할이 완전히 다릅니다. robots.txt는 크롤러의 접근을 허용하거나 차단하는 규칙이고, llms.txt는 AI가 참고할 핵심 자료를 안내합니다. 한 사이트에 둘 다 두는 것이 정상이며, 서로 충돌하지 않습니다.
아직 표준이 확정되지 않았는데 지금부터 준비해야 하나요?
초기에 준비하는 편이 유리합니다. 표준으로 자리 잡았을 때, 이미 준비된 사이트가 AI 생태계에서 우선 인용될 가능성이 큽니다. 다만 표준 미확정 상태인 만큼 "필수"가 아니라 "선제 대비"라는 관점으로 접근하는 것이 합리적입니다.
llms.txt와 llms-full.txt는 어떻게 다른가요?
llms.txt는 핵심 요약 인덱스이고, llms-full.txt는 전체 내용을 담은 확장판입니다. llms.txt가 목차라면 llms-full.txt는 본문 전체에 가깝습니다. 두 파일을 함께 제공하면 AI는 빠른 개요와 심층 정보를 동시에 활용할 수 있습니다.
워드프레스나 블로그 플랫폼에서도 적용할 수 있나요?
가능은 하지만 플랫폼에 따라 루트 디렉터리에 직접 파일을 올리기 어려운 경우가 있습니다. 플러그인이나 SaaS 기능으로 우회하는 방법이 늘고 있으니, 사용 중인 플랫폼이 루트 파일 업로드를 지원하는지부터 확인하는 것이 좋습니다.
llms.txt만 만들면 AI가 우리 사이트를 무조건 인용하나요?
그렇지 않습니다. llms.txt는 AI가 핵심 문서를 더 잘 찾도록 돕는 안내 장치일 뿐, 인용을 보장하지 않습니다. 본문 콘텐츠의 품질과 신뢰도가 먼저입니다. 좋은 콘텐츠가 있어야 llms.txt가 제 역할을 합니다.
llms.txt는 거창한 기술이 아닙니다. AI에게 "우리 사이트에서 중요한 건 이것입니다"라고 한 장으로 정리해주는 안내도일 뿐입니다. 오늘 핵심 문서 5개만 골라 마크다운으로 정리하고, 루트에 올려보는 것부터 시작할 수 있습니다.
다만 무엇을 핵심으로 지정하느냐가 결과를 가릅니다. 어떤 문서를 앞줄에 세워야 AI 인용에 유리할지 막막하다면, 무료 SEO 진단을 신청해보세요. 사이트 구조를 함께 보고, llms.txt에 무엇을 넣고 무엇을 뺄지 구체적으로 정리해 드립니다.