| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 개발자
- 그리디알고리즘
- 백준
- JPA
- 개발
- 프레임워크
- cleancode
- Elasticsearch
- API
- 데이터베이스
- spring boot
- Spring
- 코딩테스트
- AI
- 기술블로그
- 알고리즘
- database
- 애자일기법
- Java
- kotlin
- framework
- 코드
- 클린코드
- Baekjoon
- 그리디
- 자바
- 엘라스틱서치
- 스프링
- 코딩
- ES
- Today
- Total
목록전체 글 (227)
튼튼발자 개발 성장기🏋️
RAG (Retrieval Augmented Generation)LLM의 한계 환각 지식 컷오프 보안 및 개인화 불가Retrieval (검색) 대규모 언어 모델(LLM)이 학습하지 않은 정보를 가져오는 것 질문과 가장 연관성이 높은 문서 조각들을 벡터 DB에서 찾음Augmented (증강) 검색된 문서 조각을 사용자의 원래 질문과 합쳐서 "이 문서를 참고해서 질문에 답해줘"라는 식의 확장된 프롬프트 생성Generation (생성) 제공된 확실한 증거 데이터를 바탕으로 왜곡 없는 정확한 답변을 생성 Caution RAG는 환각을 줄이는 방법이지 완전히 없애는 방법은 아니다. 검색된 문서가 부정확하거나 질문과 관련없는 문서가 들어가면 답변도 틀릴 수 있다.Vector DBEmbedding ..
코드 1도 모르는 비개발자가 회사 문서로 답하는 AI 만들기 ChatGPT는 우리 회사 정책을 모른다. 그런데 알게 만들 수 있다면? 이 글은 코드 한 줄 없이 회사 문서를 학습시킨 Discord AI 비서를 만들면서 겪은 모든 과정과 시행착오의 기록이다. PROLOGUE "우리 회사 휴가 정책 알려줘"라고 AI한테 묻고 싶었다 나는 개발자다. 언젠가 회사 내부 정책이나 내가 담당하는 서비스의 도메인 지식 또는 서비스 정책을 한 번에 알아낼 수 있는 방법을 생각했다. "우리 팀 OKR 진행 상황 정리해줘"라고 물으면 AI는 모른다. "지난주 회의록에서 결정된 사항만 추려줘"도 마찬가지. 우리 회사의 모든 지식은 Google ..
Rules와 Skills의 명확한 분리블로그에서 제시한 .cursor/rules와 .cursor/skills 구조가 인상 깊었다. 나는 그동안 skills를 정의를 하고 사용하더라도 코드 작성 rule에 대해서는 AI에게 지시할 때마다 마크다운 파일에 규칙을 정리해두고 첨부(@ 사용)를 통해 인지하도록 했는데, IDE 레벨에서 프로젝트 구조에 따라 자동으로 컨텍스트를 주입한다는 게 확실히 체계적이다. 특히 globs 옵션으로 특정 경로에서만 규칙을 활성화하는 부분에서 새롭게 한가지 깨달았다. src/queries/**/*.ts 파일을 건드릴 때만 React Query 규칙을 주입하면, 불필요하게 전체 컨텍스트를 차지하지 않으니 토큰 비용도 아끼고 응답도 빨라지겠구나!!!생각해보니 LLM이 이미 아는 내용..
"말로 백 번 설명하는 것보다, 한 번의 강력한 시스템적 통제가 낫다." 바이브 코딩으로 짠 코드, 자꾸 에러가 나고 산으로 간다면 정답은 하네스(Harness)에 있다. 최근 개발 생태계는 '바이브 코딩(Vibe Coding)'이라는 새로운 패러다임에 열광하고 있다. 자연어로 "이런 기능 만들어줘", "이 페이지 디자인을 이렇게 바꿔줘"라고 말만 하면 AI가 뚝딱 코드를 만들어내는 시대다. 개발 속도는 이전과는 비교할 수 없을 정도로 비약적으로 빨라졌다. 하지만 실무 프로젝트에 AI를 본격적으로 도입해 본 사람이라면 깊이 공감할 것이다. AI는 강력하지만, 동시에 아주 위험하다. 기존 코드의 규칙을 무시하거나, 전혀 엉뚱한 아키텍처를 도입해 프로젝트 전체를 망가뜨리기도 한..
우아한형제들 기술블로그에서 [RAG, 들어는 봤는데… 내 서비스엔 어떻게 쓰지?]라는 글을 읽었다. 솔직히 RAG에 대해서는 기본적인 개념만 알고 있고, 실제로 구현해본적은 딱 한 번 있다. 당시에 RAG를 왜 써야하는지, 임베딩을 할때 텍스트(데이터)를 어떻게 청킹해서 벡터화 해야하는지 등 많은 난제에 부딪혔었다. 이 글은 마치 선배 개발자가 옆에서 "우리도 이렇게 삽질했어!"라고 말해주는 것처럼 구체적이고 솔직한 것 같다. 특히 MCP를 먼저 시도했다가 결국 RAG 서버를 직접 구현하게 된 과정이 매우 공감되었다.MCP의 꿈과 현실나도 처음에는 MCP가 뭔가 표준화된 은탄환이 될 줄 알았다. Anthropic에서 제안한 프로토콜이니까 앞으로 모든 LLM 도구들이 이걸 따르지 않을까 하는 기대가 있었다..
CLI에서 계획을 시작하고, 웹의 Claude Code에서 초안을 작성한 뒤, 원격으로 또는 터미널에서 실행한다 울트라플랜(Ultraplan)은 리서치 프리뷰 단계이며 Claude Code v2.1.91 이상이 필요하다. 피드백에 따라 동작 방식과 기능이 변경될 수 있다. 울트라플랜은 계획 작업을 로컬 CLI에서 웹의 Claude Code 세션으로 넘기며, 해당 세션은 플랜 모드로 실행된다. Claude가 클라우드에서 계획 초안을 작성하는 동안, 사용자는 터미널에서 계속 작업할 수 있다. 계획이 준비되면 브라우저에서 열어 특정 섹션에 댓글을 달고, 수정을 요청하고, 어디서 실행할지 선택한다. 울트라플랜은 터미널이 제공하는 것보다 더 풍부한 검토 화면이 필요할 때 유용하다. ..
이론으로만 배운 파인튜닝을 실제로 적용해보자. 이 글에서는 금융 뉴스 분석기를 주제로, 합성 데이터 생성부터 멀티 GPU 학습, LoRA 병합, vLLM 서빙까지 전체 파이프라인을 단계별로 정리한다. 두 가지 학습 프레임워크(LLaMA-Factory와 Hugging Face TRL)를 모두 다루며, 각각의 특징과 사용법을 비교한다. 1. 프로젝트 개요: 금융 뉴스 분석기 이번 실습의 목표는 금융 뉴스를 입력받아 특정 종목에 영향을 주는지 자동으로 판별하는 LLM을 만드는 것이다. 모델이 해야 할 일 종목 연관 여부 판별: 뉴스가 특정 회사(종목)와 관련이 있는지 판단 (is_stock_related) 긍정 영향 종..
데이터의 성질로 바라보는 MSA올리브영 기술 블로그에서 올영매장의 MSA 데이터 연동 전략에 대한 글을 읽었다. 솔직히 처음에는 "또 MSA 얘기인가?" 하고 가볍게 봤는데, 읽다 보니 나도 모르게 공감과 비판을 하면서 재밌게 읽고 있었다. 내가 생각하는 이 글의 핵심은 단순히 "Redis를 써!!" 혹은 "Kafka를 써!!"와 같은 1차원 적인 기술적 방법이 아니라, "흩어진 데이터를 연동할 때에는 그 데이터가 어떤 성질을 가졌는지 먼저 바라봐야 한다!!"라는 것 같다.특히나 "그냥 API로 가져오면 되는 것 아닌가?"라는 질문에 대한 답변 방식이 인상 깊었다. 실무에서 개발/비개발 직군 동료들로부터 가장 많이 듣는 질문 중 하나인데 너굴님은 Use Case, 변경 특성, 라이프사이클이라는 세 가지 ..
