Daily Briefing

July 5, 2026
2026-07-04
32 articles

Leanstral 1.5: Proof Abundance for All

Mistral AI가 공식 검증 및 수학적 증명 성능을 대폭 향상시킨 무료 오픈소스 모델 Leanstral 1.5를 출시했습니다.

  • 총 119B 매개변수 중 6B 활성 매개변수를 가진 Apache-2.0 라이선스 기반의 Lean 4 공식 검증 모델입니다.
  • 중간 훈련, 지도 파인튜닝, CISPO를 활용한 강화학습 과정을 거쳐 다회차 환경 및 코드 에이전트 환경에서 훈련되었습니다.
  • 실제 오픈소스 저장소를 대상으로 검증을 수행하여 이전에 발견되지 않았던 오류 5개를 찾아내 실용성을 입증했습니다.
Notable Quotes & Details
  • 119B total
  • 6B active parameters
  • 587/672 PutnamBench
  • 87% on FATE-H
  • 34% on FATE-X
  • 5 previously unknown bugs
  • 57 repositories

공식 검증, 수학적 증명, 소프트웨어 안정성 검증에 관심이 있는 AI 연구원 및 소프트웨어 개발자

Bringing more control over your connectors

Mistral AI가 엔터프라이즈 플랫폼과의 안전한 연동을 위해 세분화된 관리자 제어 기능, 커넥터 스코프 API 키, 다중 계정 지원 및 디버거 등 강화된 커넥터 제어 기능을 출시했습니다.

  • 워크스페이스 및 조직 단위로 커넥터 접근 권한을 관리하고 개별 도구의 활성화 여부를 설정할 수 있는 관리자 제어 기능 제공
  • 자동화된 AI 작업에서 다중 계정 인증을 지원하고 타사 시스템 연동 시 도용을 방지하는 커넥터 스코프 API 키 도입
  • 연결 오류 분석을 위한 커넥터 디버거 제공 및 Workflows, Vibe Code와의 통합 지원
Notable Quotes & Details
  • 60개 이상의 사전 구축된 커넥터 제공

기업의 IT 관리자, AI 시스템 개발자 및 엔터프라이즈 솔루션 아키텍트

Workflows for work that runs the business

미스트랄 AI가 기업용 AI 프로세스의 개념 증명부터 프로덕션 전환까지 안정적으로 오케스트레이션하고 관리할 수 있는 'Workflows' 기능을 공개 프리뷰로 출시했습니다.

  • Workflows는 기업용 AI 파이프라인의 내구성, 관찰 가능성, 결함 허용성을 보장하는 오케스트레이션 레이어 역할을 합니다.
  • 개발자는 파이썬으로 워크플로우를 작성하고 이를 Le Chat에 게시하여 조직 내 누구든 실행할 수 있도록 지원하며, Studio를 통해 실행 단계를 추적할 수 있습니다.
  • 중간에 인간의 승인이 필요한 단계는 단 한 줄의 코드로 구현 가능하여, 대기 시간 동안 리소스 소비 없이 일시 중지했다가 승인 후 재개할 수 있습니다.
Notable Quotes & Details
  • wait_for_input()
  • ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale, Moeve

엔터프라이즈 AI 개발자 및 기업 시스템 구축 담당자

Introducing Forge

Mistral AI가 기업들이 자체 보유한 전문 지식과 데이터를 바탕으로 맞춤형 AI 모델을 구축할 수 있도록 지원하는 시스템인 Forge를 출시했습니다.

  • Forge는 공공 데이터 기반의 범용 AI와 기업의 실제 내부 요구사항 사이의 격차를 좁혀주는 기업용 맞춤형 AI 모델 구축 시스템입니다.
  • 사전 학습, 사후 학습, 강화 학습 등 모델 생애주기 전반의 최신 훈련 방식을 지원하여 도메인 특화 지식 학습과 워크플로우 정렬을 가능하게 합니다.
  • 기업이 자체 인프라 환경에서 모델을 훈련하고 통제할 수 있도록 지원하여 데이터 및 모델에 대한 완전한 통제권과 전략적 자율성을 보장합니다.
Notable Quotes & Details
  • ASML
  • DSO National Laboratories Singapore
  • Ericsson
  • European Space Agency
  • Home Team Science and Technology Agency (HTX) Singapore
  • Reply

자체 프라이빗 데이터를 활용해 고도의 맞춤형 AI 모델과 에이전트를 구축하려는 기업 고객 및 개발자

Mistral AI partners with NVIDIA to accelerate open frontier models

Mistral AI가 NVIDIA 네모트론 연합(NVIDIA Nemotron Coalition)의 창립 멤버로 참여하여 개방형 첨단 인공지능 모델 개발을 가속화한다.

  • Mistral AI는 NVIDIA와 협력하여 개방형 첨단 AI 모델을 공동 개발하며, 자사의 전문 아키텍처 및 플랫폼을 NVIDIA의 컴퓨팅 자원 및 합성 데이터 파이프라인과 결합한다.
  • 연합의 첫 번째 이니셔티브는 NVIDIA DGX Cloud에서 훈련되어 향후 출시될 NVIDIA Nemotron 4 제품군의 기반이 될 오픈소스 베이스 모델이다.
  • Mistral AI는 협력의 일환으로 전 세계 개발자와 연구자들이 자유롭게 혁신할 수 있도록 지원하는 Mistral Small 4 모델을 출시했다
Notable Quotes & Details
  • NVIDIA Nemotron Coalition
  • Mistral Small 4
  • “Open frontier models are how AI becomes a true platform,” said Arthur Mensch, cofounder and CEO of Mistral AI.
  • NVIDIA DGX Cloud
  • NVIDIA Nemotron 4

AI 개발자, 연구원, 기업 관계자 및 기술 업계 종사자

Trunk Tools' stack cut document review from 60 days to 10 by ditching general-purpose models

건설 프로젝트 관리 기업인 Trunk Tools가 범용 인공지능 모델 대신 특화된 3계층 아키텍처를 도입하여 문서 검토 기간을 60일에서 10일로 대폭 단축했습니다.

  • 범용 거대언어모델(LLM)은 분야별 전문 용어, 약어, 고유 포맷 및 기업 내부 데이터의 추론에 한계가 있어 특화 모델 구축이 필요합니다.
  • Trunk Tools는 인지(perception), 의미(semantics), 에이전트(agents)로 구성된 3계층 아키텍처를 통해 대규모 건설 문서를 자율 분석하고 현장 오류를 방지하고 있습니다.
  • 전문가들은 도메인 특화 모델 구축 시 소량의 실제 고품질 데이터 파인튜닝과 RAG(검색 증강 생성)의 결합, 그리고 혼합 전문가(MoE) 방식의 하이브리드 스택을 권장합니다.
Notable Quotes & Details
  • 문서 검토 기간을 60일에서 10일로 단축 (cut document review from 60 days to 10)
  • "실제 전문가로부터 얻은 수천 개의 예시가 긁어모은 노이즈 섞인 수백만 개의 예시보다 낫다" - Kriti Faujdar (A few thousand examples from real practitioners beats millions of scraped, noisy ones)

AI 인프라 및 에이전트 개발자, 산업 특화 AI 도입을 검토 중인 기업 임직원, 건설 및 프로젝트 관리 분야 관계자

China wants cinemas to sell you karaoke and coffee, not just tickets

중국 정부가 박스오피스 매출 급감을 해결하기 위해 영화관에 AI 컨시어지, 노래방, 커피숍 등 다양한 부대시설과 소매 공간을 결합하도록 권고하고 있습니다.

  • 중국 국가영화국과 국가시장감독관리총국이 영화관 로비와 유휴 상영관을 리테일 및 문화 공간으로 전환하도록 유도하는 지침을 발표했습니다.
  • 2026년 상반기 중국 박스오피스 매출은 전년 동기 대비 40.6% 감소한 약 25억 6,000만 달러로, 팬데믹 기간을 제외하면 2014년 이후 최저치를 기록했습니다.
  • 정부 지침에 따른 개조와 부대시설 도입 비용은 매출 감소로 어려움을 겪는 극장 체인과 독립 영화관들에 큰 재정적 부담이 될 수 있습니다.
Notable Quotes & Details
  • 40.6%
  • 2.56bn
  • 2026
  • 93,187
  • 7.45bn
  • 2025
  • 15.77
  • five million cups in three days

AI 및 영화 산업 관계자, 중국 비즈니스 시장 분석가

Macron and Modi are winning the AI infrastructure race with text messages and personal meetings

프랑스의 에마뉘엘 마크롱 대통령과 인도의 나렌드라 모디 총리가 글로벌 기술 기업 CEO들과의 직접적인 외교 및 개인적 친분을 통해 대규모 AI 인프라 투자 유치 경쟁을 주도하고 있습니다.

  • 마크롱 프랑스 대통령은 소프트뱅크의 손정의 회장과의 직접적인 연락을 통해 프랑스 내 750억 유로 규모의 AI 데이터 센터 건립 약속을 받아냈습니다.
  • 모디 인도 총리는 아마존 CEO 앤디 재시와의 직접 회동 후 480억 달러 규모의 투자 약속을 확보하는 등 적극적인 정상 외교를 펼치고 있습니다.
  • 글로벌 AI 인프라 유치 경쟁이 단순한 정책 문서 작성에서 벗어나 국가 원수들이 직접 글로벌 자본가와 소통하는 개인적 인맥 및 외교전 양상으로 변화하고 있습니다.
Notable Quotes & Details
  • 소프트뱅크: 프랑스에 2031년까지 3.1기가와트 규모(1차 450억 유로)를 포함해 최대 750억 유로(5기가와트 용량) AI 데이터 센터 구축 투자 약속
  • 아마존: 2030년까지 인도에 480억 달러 투자 약속 (이 중 210억 달러는 뭄바이 및 하이데라바드의 AI 및 클라우드 인프라 확장에 투입)
  • 릴라이언스 인더스트리: 7년간 AI 인프라에 1,100억 달러 투자 약속
  • 구글: 인도 최초의 기가와트급 AI 허브 구축을 위해 150억 달러 서약
  • The people who control the capital respond to direct engagement from heads of state, not policy papers.

글로벌 AI 기술 트렌드, 정치와 기술의 결합, 국가적 AI 인프라 투자 및 비즈니스 외교에 관심이 있는 독자층

India summons Meta over Instagram ads promoting child sexual abuse material

인도 정보기술부가 인스타그램에서 아동 성학대물(CSAM)을 홍보하는 유료 광고가 게재되었다는 BBC 조사 결과와 관련해 메타 임원들을 소환했다.

  • BBC 조사 결과, 인도 내 인스타그램 테스트 계정에 아동 성학대물을 홍보하는 광고 약 30개가 노출되었으며, 이는 텔레그램 채널로 연결되었다.
  • 메타는 최초 신고에 대해 커뮤니티 가이드라인을 위반하지 않았다고 답변했으나, BBC가 공식 취재를 시작한 후에야 관련 광고와 계정을 차단했다.
  • 인도 정보기술부는 메타 측의 방치 의혹에 대해 대면 해명을 요구하기 위해 임원 소환을 지시했다.
Notable Quotes & Details
  • 7월 3일
  • 99루피
  • 광고 약 30개
  • We have taken note of the reports that have alleged that there was inaction from Meta, despite being made aware of ads that contained CSAM, offensive and illegal search words
  • no system is perfect, and our review process may not detect all policy violations

IT 및 플랫폼 규제 관련 종사자, 아동 안전 인권 운동가, 메타 사용자 및 투자자

OpenAI apparently never visited the site of its flagship UK AI project

OpenAI가 영국의 핵심 AI 인프라 프로젝트인 '스타게이트 UK' 데이터 센터 부지를 발표 전에 한 번도 방문하지 않았다는 사실이 밝혀져 정부의 실사 미흡 논란이 일고 있습니다.

  • OpenAI는 '스타게이트 UK' 프로젝트 발표 전 핵심 예정 부지를 방문하지 않았으며, 해당 부지는 여전히 비계 보관소로 사용 중이고 착공 흔적도 없는 상태였습니다.
  • 영국 정부는 기업들의 자체 보고에만 의존해 계약이 체결되지 않은 투자건을 대대적으로 홍보하는 등 '유령 투자' 논란을 자초했습니다.
  • OpenAI는 영국의 높은 산업용 전기 요금(미국 및 북유럽의 약 4배)과 저작권 규제 미결정을 이유로 2026년 4월에 프로젝트를 공식적으로 일시 중단했습니다.
Notable Quotes & Details
  • 2026년 4월
  • 2025년 9월
  • 8,000 Nvidia GPUs
  • 31,000
  • 310억 파운드
  • 2026년 1분기
  • 23,040 Nvidia GPUs
  • 2027년 초
  • 19억 파운드
  • 140억 파운드

AI 산업 동향, 글로벌 IT 인프라 투자 정책, 그리고 영국의 기술 규제에 관심이 있는 비즈니스 및 정책 의사 결정자

The fanfiction community is at war with AI — and itself

생성형 AI를 이용해 작성된 팬픽션을 찾아내려는 팬덤 커뮤니티의 움직임과 그 감지 기술의 한계 및 갈등에 관한 이야기입니다.

  • 팬픽션 플랫폼 AO3에서 앤스로픽의 Claude 봇이 남긴 특정 코드를 감지해 화면을 빨간색으로 바꾸는 스킨이 배포되었습니다.
  • 이 감지 도구는 Claude에서 직접 복사하여 붙여넣은 텍스트는 정확히 감지하지만, 서식을 지우고 붙여넣는 경우 감지하지 못하는 한계가 있습니다.
  • AI 탐지 도구의 등장으로 인해 작가들을 공개적으로 비난하고 낙인찍는 마녀사냥식 문화가 형성되며 커뮤니티 내 갈등이 깊어지고 있습니다.
Notable Quotes & Details
  • font-claude-response-body
  • June 29th
  • @heatedrivalryai
  • Fandom is a uniquely connective, collaborative space. It thrives on the human element and the creative spark which drives it and feeds off it. If we unknowingly allow AI to corrupt these spaces, what will be left of them?

AI 기술의 창작물 적용 및 이로 인한 온라인 창작 커뮤니티(팬덤)의 갈등에 관심이 있는 독자층

NVIDIA AI Introduces ASPIRE: A Self-Improving Robotics Framework Reaching 31% Zero-Shot on LIBERO-Pro Long Tasks

NVIDIA와 주요 대학 연구진이 지속적인 학습을 통해 로봇 제어 프로그램을 작성·수정하고, 검증된 해결책을 재사용 가능한 기술 라이브러리로 증류하는 로봇 학습 프레임워크 ASPIRE를 개발했습니다.

  • ASPIRE는 코디네이터-액터 아키텍처를 기반으로 하며, 에이전트 간에 가공되지 않은 궤적이 아닌 증류된 기술(distilled skills)만을 공유합니다.
  • 조粗 피드백 대신 기본 기능 단위의 다중 모드 트레이스를 제공하는 폐루프 로봇 실행 엔진을 사용하여 실패 원인을 정밀 진단하고 복구합니다.
  • 진화 검색(Evolutionary search)을 도입해 여러 개의 후보 프로그램을 생성함으로써 에이전트가 단일 해결책에만 갇히지 않고 다양한 전략을 탐색하도록 유도합니다.
Notable Quotes & Details
  • 31%
  • LIBERO-Pro
  • Claude Code with Claude Opus 4.6
  • 1M-token

AI 및 로보틱스 연구원, 로봇 제어 소프트웨어 개발자

PM의 채용 공고가 바뀌었다 (이력서 대신 60초 데모를 내는 시대)

AI 기술의 발전으로 PM 채용 공고가 기존의 문서 작성 및 요구사항 정의 중심에서 AI 툴을 활용해 직접 프로토타입을 만들고 평가하는 '프로덕트 빌더(Product Builder)' 중심으로 급변하고 있습니다.

  • 아마존, 링크드인, 구글, 앤스로픽 등 주요 기술 기업들이 이력서 대신 데모 영상을 요구하거나 AI 에이전트 및 프로토타입 직접 구축 능력을 필수 요건으로 내세우고 있습니다.
  • 기존 PM의 역할이 문서 작성 및 관리였다면, 신규 PM은 직접 에이전트를 구축하고 Eval(평가 기준) 설계와 품질을 소유하는 실무 제작자로 진화하고 있습니다.
  • 이러한 변화는 PM의 대체가 아니라 AI 툴을 통해 반복 업무를 자동화하고 본질적인 제품 설계 및 빌드에 집중할 수 있는 기회로 작용합니다.
Notable Quotes & Details
  • Amazon Ring: 'Builder PM' 포지션 신설
  • LinkedIn: APM 프로그램을 APB(Associate Product Builder) 프로그램으로 전환 및 60초 데모 영상 제출 요구
  • Google: GenAI·Agentic AI·LLM 관련 PM 경험 1년 필수

IT 기업의 프로덕트 매니저(PM), 서비스 기획자, 개발자, 및 테크 업계 구직자

Show GN: 축구감독 공항 대탈출 게임

Phaser 3와 AI 기반 스프라이트 에셋 생성 스킬을 활용하여 개발한 축구감독 공항 탈출 러닝 액션 게임 및 관련 AI 툴에 대한 소개입니다.

  • HTML5 캔버스 및 WebGL 기반의 2D 게임 프레임워크인 Phaser 3를 사용하여 브라우저 러닝 액션 게임을 개발함
  • 자연어 지시로 스프라이트 시트 생성 및 배경 제거, 프레임 분할, 정렬 등을 자동 처리하는 agent-sprite-forge 툴을 에셋 제작에 활용함
  • Claude Code를 이용해 20년 전 상용 게임을 거의 수정 없이 브라우저로 이식하는 등의 재미있고 유용한 시도들을 언급함
Notable Quotes & Details
  • https://github.com/0x0funky/agent-sprite-forge
  • 20년 전

웹 게임 개발, Phaser 3 프레임워크, AI 기반의 게임 에셋 및 스프라이트 생성 도구에 관심이 있는 개발자

미국의 개인정보 비상사태

미국 상무부의 지시로 인해 연방 통계기관의 현대적 개인정보 보호 기법 사용이 금지되고 1970년대식 기법으로 회귀하면서 세분화된 공공 데이터의 유용성과 기밀성이 동시에 위협받고 있습니다.

  • 2026년 6월 4일 미국 상무부의 DAO 216-26 지시는 차등 개인정보보호 및 노이즈 주입 등의 현대적 데이터 보호 기법 사용을 금지하고 반올림, 집계, 삭제 등 1970년대식 기법만 허용했습니다.
  • 이로 인해 산업 및 지역 단위의 세부 통계 유용성이 크게 저하되거나, 단순한 산술을 통해 개별 사업체의 민감 정보가 재구성되는 보안 허점이 발생할 수 있습니다.
  • 이번 지시의 배경에는 과학적 타당성보다 정치적 이해관계(Project 2025 및 Center for Renewing America 등의 영향)가 강하게 작용했다는 비판이 있습니다.
Notable Quotes & Details
  • 2026년 6월 4일
  • DAO 216-26
  • 13 U.S. Code Section 9
  • BEA Working Paper WP2026-9
  • 2002년
  • 1990년
  • 2008년
  • 2020 Census
  • 2030 Census

IT 및 데이터 보안 전문가, 통계학자, 공공 정책 결정자

에이전트 자율성 수준

에이전트형 엔지니어링에서 에이전트의 자율성과 오케스트레이션 수준을 정의하고 이를 검증하는 방안에 대한 분석

  • 에이전트형 엔지니어링은 프롬프트 작성보다 운영 설계에 가까워지고 있으며 calibrated autonomy와 검증 관리가 핵심임
  • 다중 에이전트 역량은 단일 에이전트의 자율성을 뜻하는 agency 축과 여러 작업을 조율하는 orchestration 축의 두 가지로 나누어 평가해야 함
  • Claude Code 분석 데이터에 따르면 사람은 계획 결정의 약 70%를, Claude는 실행의 약 80%를 담당하는 협업 양상이 나타남
Notable Quotes & Details
  • 약 40만 세션
  • 약 23.5만 명
  • 70%
  • 80%
  • 2026년 초

소프트웨어 엔지니어, AI 에이전트 시스템 설계자 및 개발자

Notes: 본문 끝부분이 일부 잘려 있으나 전체적인 문맥과 핵심 정보 파악에는 지장이 없음

Costco는 안티-Amazon이다

무한 구색과 초고속 배송을 추구하는 Amazon과 달리 제한된 품목, 오프라인 구매, 빠른 재고 회전 등 단순 물류로 매출 성장을 이끄는 Costco의 비즈니스 모델 분석

  • Costco는 약 4,000개의 제한된 SKU만을 취급하여 고객의 탐색 부담을 줄이고 구매팀이 상품 검토에 집중하게 함으로써 품질과 가격 경쟁력을 확보함
  • 적은 SKU 수 덕분에 공급업체를 압박하지 않고도 빠른 재고 회전을 통해 짧거나 음수인 현금전환주기(CCC)를 달성함
  • Costco의 매출 대비 판관비 비율은 10% 수준으로 Amazon의 비-AWS 매출 대비 배송비 비율인 40%와 비교해 뛰어난 물류 비용 효율성을 보임
Notable Quotes & Details
  • 최근 5년간 매출을 매년 평균 10% 이상 늘림
  • 약 4,000개 SKU
  • Walmart Supercenter의 약 130,000개 SKU
  • 매출 대비 판관비 10%
  • Amazon의 비-AWS 매출 대비 배송비 40%

소매업계 종사자, 이커머스 및 물류 전문가, 비즈니스 전략가

BaryGraph - knowledge graph where every relationship is its own embedded document (not an edge) [R]

BaryGraph는 모든 관계를 엣지가 아닌 독자적인 벡터를 가진 1등 시민 문서(BaryEdge)로 취급하고 이를 재귀적으로 쌓아 이종 도메인 간의 구조적 연결을 시각화하는 지식 그래프 모델이다.

  • 일반적인 RAG나 벡터 검색이 놓치는 도메인 간의 간접적이고 구조적인 연관 관계(예: 방사성 감쇠와 사용되지 않는 단어의 소멸 현상 간의 공통 패턴)를 포착할 수 있다.
  • 관계 자체를 임베딩하는 BaryEdge를 형성하고, 두 BaryEdge를 다시 하위의 세 번째 Edge로 연결하여 MetaBary 삼항조(triad) 계층을 재귀적으로 구축한다.
  • SimLex-999 및 WordSim-353 벤치마크 검증 결과, 단순 코사인 유사도는 인간의 판단과 거의 상관관계가 없었으나(ρ ≈ −0.04), 구조적 메트릭은 유의미한 상관관계(ρ ≈ 0.32–0.53, p < 10⁻¹⁵)를 보였다.
Notable Quotes & Details
  • ρ ≈ −0.04
  • ρ ≈ 0.32–0.53
  • p < 10⁻¹⁵
  • 6.6M docs
  • 768-dim
  • https://github.com/oleksiy-perepelytsya/bary-vector
  • https://zenodo.org/records/20186500

인공지능 연구원, 검색(RAG) 및 지식 그래프 개발자, 자연어 처리(NLP) 엔지니어

Proposal: Use semantic compression as input diffusion to read sessions larger than the context window [R]

컨텍스트 창 크기를 초과하는 긴 세션을 처리하기 위해 시맨틱 압축을 입력 디퓨전 방식으로 사용하여 점진적으로 텍스트를 읽고 출력하는 새로운 시스템 제안

  • 텍스트를 단계별로 압축하여 흐릿한 상태에서 선명한 상태로 점진적으로 렌더링하는 디퓨전 기법에서 영감을 얻음
  • 각 단계를 컨텍스트 창에 맞게 압축하여 모델이 현재 조각, 입력, 현재 출력만 읽도록 제한하여 전체적인 구조를 보존함
  • Qwen2.5 7B 모델을 활용한 기본 테스트에서는 개별 단계는 수행 가능하나 엔드투엔드 처리 및 비훈련 모델에서의 신뢰성이 부족하여 향후 위치 인식 파인튜닝 연구가 필요함
Notable Quotes & Details
  • Qwen2.5 7B
  • https://dev-boz.github.io/diffusive-semantic-compression/demo/architecture-demo.html

인공지능 및 머신러닝 연구자, 대규모 언어 모델 컨텍스트 확장 기술 개발자

google/tabfm-1.0.0

구글 리서치에서 추가적인 미세조정이나 하이퍼파라미터 탐색 없이 제로샷으로 표 형식 데이터의 분류 및 회귀 분석을 수행할 수 있는 기반 모델인 TabFM을 출시했습니다.

  • 구글 리서치가 개발한 제로샷 표 형식 기반 모델(tabular foundation model)인 TabFM이 공개되었습니다.
  • 수치형 및 범주형 열이 혼합된 정형/표 형식 데이터에서 분류 및 회귀 분석을 지원합니다.
  • 미세조정이나 하이퍼파라미터 탐색 없이, 학습 예제를 컨텍스트로 전달하여 단 한 번의 순방향 패스(single forward pass)로 예측을 수행합니다.
Notable Quotes & Details
  • TabFM
  • google/tabfm-1.0.0

표 형식 데이터를 다루는 데이터 사이언티스트 및 기계학습 연구자

Qwen3.6-27b-mtp-q8 successfully created an A* pathfinding implementation on a test game built in Java from scratch.

Qwen3.6-27b-mtp-q8 모델이 자바로 만든 테스트 게임에서 A* 길찾기 알고리즘 구현에 성공했습니다.

  • 개발자가 로컬에서 Claude Code와 Qwen3.6-27b-mtp-q8 모델을 사용하여 친구의 자바 테스트 게임에 A* 길찾기 기능을 구현하려고 시도했습니다.
  • 모델이 실시간으로 로그를 모니터링하고 자율적으로 코드를 리팩토링하며 테스트 게임을 다시 실행하는 자동 테스트 스위트를 구축하여 반복 테스트를 수행했습니다.
  • NPC가 블록을 오르고 내리며 장애물을 매끄럽게 피해 갈 수 있는 수준의 길찾기 기능을 구현하는 데 성공했습니다.
Notable Quotes & Details
  • Qwen3.6-27b-mtp-q8
  • Index Errors
  • %100 autonomous
  • 12 hours

인공지능을 활용한 게임 개발 및 로컬 LLM의 코드 생성 능력에 관심이 있는 개발자

[Paper] Multi-Block Diffusion Language Models

단일 블록 확산 언어 모델(BD-LM)을 다중 블록 확산(MultiBD)으로 확장하고 디코딩 속도와 성능을 향상시키는 Multi-Block Diffusion Language Models(MBD-LM)을 제안합니다.

  • 기존 단일 블록 확산 언어 모델의 교사 강제(Teacher Forcing) 훈련 방식과 MultiBD 추론 환경 간의 괴리를 해소하기 위해 MultiTF(Multi-block Teacher Forcing) 사후 훈련 방식을 도입했습니다.
  • Prefix-cache 재사용을 보존하고 입력 형태를 고정하여 병렬 디코딩을 실제 연산 속도 향상으로 전환하는 블록 버퍼(Block Buffer) 기반 최적화 디코딩 알고리즘을 제안했습니다.
  • MBD-LLaDA2-Mini 모델 적용 시 평균 TPF(Tokens Per Forward pass)와 평균 정확도가 동시에 향상되었으며, DMax 적용 시 성능 하락을 최소화하면서 더 높은 처리 속도를 달성했습니다.
Notable Quotes & Details
  • MBD-LLaDA2-Mini increases average Tokens Per Forward pass (TPF) from 3.47 to 6.19 and improves average accuracy from 79.95% to 81.03%
  • when combined with DMax, MBD-LLaDA2-Mini-DMax reaches an average TPF of 9.34 with only a 1.02% accuracy drop
  • arXiv : https://arxiv.org/abs/2606.29215

자연어 처리, 생성형 AI 및 디코딩 최적화를 연구하는 AI 연구원 및 개발자

RTX5090, gemma-4-31B-it-Q6_K.gguf. Context: before - 35k, after - 80k!

RTX 5090 환경에서 gemma-4-31B-it-Q6_K.gguf 모델의 컨텍스트 크기를 35k에서 80k로 확장할 수 있는 도커 실행 및 llama.cpp 설정 방법 공유

  • Deepseek Flash뿐만 아니라 Gemma 4 모델에서도 컨텍스트 크기 확장이 가능하다는 점을 발견함
  • GGML_CUDA_NO_PINNED=1 환경변수 설정과 --backend-sampling, --parallel 1 옵션을 통해 80,000 컨텍스트 크기를 구현함
  • llama.cpp 웹 인터페이스 사용 시 Backend sampling 체크박스를 활성화해야 함
Notable Quotes & Details
  • before - 35k, after - 80k
  • GGML_CUDA_NO_PINNED=1
  • --ctx-size 80000

로컬 환경에서 RTX 5090과 llama.cpp를 이용해 Gemma 4 대형 언어 모델을 구동하려는 개발자 및 AI 엔지니어

A fully local, self-hosted repo index for coding agents (Rust, MIT, runs offline)

로컬 LLM 코딩 에이전트를 위해 컨텍스트 창을 낭비하지 않고 저장소를 로컬에서 인덱싱하고 MCP를 통해 서빙하는 오픈소스 도구 basemind의 릴리즈 소식입니다.

  • 300개 이상의 언어에 대한 코드 맵, git 히스토리 및 blame, 90개 이상의 포맷에 대한 문서 RAG 기능을 완전한 로컬(오프라인)로 제공합니다.
  • 구조적 질문 시 파일 전체 대신 시그니처와 행 번호만 반환하여 토큰 소모를 크게 줄이며, 필요할 때만 전체 함수 본문을 가져오는 확장 도구를 지원합니다.
  • Rust로 작성되었고 MIT 라이선스이며, MCP 서버, CLI, Claude Code 플러그인 형태로 동작합니다.
Notable Quotes & Details
  • 300+
  • 90+
  • MIT
  • https://github.com/Goldziher/basemind

로컬 모델을 코딩에 활용하면서 효율적인 저장소 컨텍스트 주입 방법을 찾는 개발자 및 AI 에이전트 사용자

'AI 토큰 지출' 지표 첫 하락세…AI 거품 붕괴 vs 수요 조정 의견 맞서

AI 토큰 지출 지수의 첫 하락세를 두고 AI 거품 붕괴와 효율성 중심의 수요 조정이라는 상반된 해석이 대립하고 있다.

  • 실리콘 데이터가 집계하는 대형언어모델 토큰 지출 지수가 지난 5월 최고점 대비 최근 20% 가까이 하락했다.
  • 하락의 원인으로는 토큰 단가 폭락, 고성능 모델에서 오픈소스 및 저가 모델로의 수요 이동, 규제에 따른 영향 등이 지목된다.
  • 과도한 투자 대비 매출 성장 격차(46%)로 인한 거품 우려와, 효율적 추론 단계 진입에 따른 경제성 개선이라는 낙관론이 맞서고 있다.
Notable Quotes & Details
  • 지난 5월 최고점을 기록한 이후 최근에는 20% 가까이 하락
  • 2023년 이후 토큰당 가격은 매년 90% 이상 폭락
  • 글로벌 AI 분야의 투자 성장률과 실제 매출 성장률 사이에는 46%의 격차가 존재하는 것으로 추산
  • 2001년 닷컴 버블 당시 통신 분야의 격차(32%)
  • 데이브드 밀러 카탈리스트 시니어 매니저: 인프라를 구축하고 모델을 훈련하는 단계에서는 비용이 천문학적으로 부각되지만, 현재의 추론 단계에서는 경제성이 눈에 띄게 개선된다
  • 루이스 나벨리에: 높은 비용 때문에 무제한 AI 토큰 사용을 자제해야 한다는 보고가 늘어나고 있다

AI 산업 동향, 테크 투자 및 IT 비즈니스 의사결정권자

메타, 앤트로픽 '클로드' 직접 서비스 추진..."클라우드 진입 준비"

메타가 자체 데이터센터에 앤트로픽의 클로드 전용 서버 환경을 구축하는 프라이빗 인스턴스 계약을 추진하며 클라우드 서비스 및 인프라 사업 진입을 준비하고 있다.

  • 메타가 데이터센터 내부에 클로드 독립 서버 환경을 격리 구축하는 프라이빗 인스턴스 계약을 앤트로픽과 최종 협상 중이다.
  • 초기에는 내부 서비스 개발에 활용하고, 중장기적으로는 광고주 네트워크 등을 통해 기업 고객에게 클로드 서비스를 제공할 계획이다.
  • 컴퓨팅 자원 부족과 토큰 제한을 극복하고, 사내 코드 증류 의혹을 방지하는 동시에 남는 컴퓨팅을 단기 임대하여 수익을 창출하려는 전략이다.
Notable Quotes & Details
  • 3일(현지시간)
  • 1일
  • 5기가와트(GW)
  • 10배
  • 연간 100억달러(약 15조원)

IT 산업 및 인프라 분석가, 테크 기업 관계자, 클라우드 시장 관찰자

미스트랄, 수학 증명·코드 검증 특화 ‘린스트랄 1.5’ 전격 공개…“퍼트넘벤치서 역대 최고 성적”

미스트랄 AI가 수학 정리 증명과 코드 검증에 최적화된 오픈소스 AI 모델인 '린스트랄 1.5'를 출시했다.

  • 린스트랄 1.5는 수학 증명 언어인 '린 4(Lean 4)'에 최적화되어 수학 정리 증명과 코드 검증을 수행하며, 전문가 혼합(MoE) 구조를 채택해 계산 비용을 크게 절감했다.
  • 정형 수학 벤치마크인 miniF2F에서 100% 성능을 기록하고, 퍼트넘벤치에서 672문제 중 587개를 해결하는 등 수학 추론에서 역대 최고 성적을 달성했다.
  • 러스트 코드를 린으로 변환해 분석한 결과 47개의 속성 위반을 발견하고 11건의 실제 버그를 확인하는 등 코드 검증 분야에서도 우수한 성과를 보였다
Notable Quotes & Details
  • 3일(현지시간)
  • 1190억개(119B)
  • 65억개(6.5B)
  • 25만6000토큰
  • 100%
  • 672문제 가운데 587개
  • 87%
  • 34%
  • 21.9
  • 28.9
  • 31.9
  • 43.2
  • 4달러
  • 300달러 이상
  • 54~68달러
  • 7분의 1
  • 5만 토큰
  • 44문제
  • 20만 토큰
  • 244문제
  • 100만 토큰
  • 493문제
  • 400만 토큰
  • 57개
  • 47개
  • 11건
  • 5건
  • 64비트

AI 연구자, 수학자, 소프트웨어 개발자 및 코드 검증 전문가

"테스트 타임 컴퓨트가 새로운 스케일링 법칙"...'엣지벤치' 공개

바이트댄스 연구팀이 AI 에이전트가 실제 실행 환경에서 피드백을 통해 재귀적 자기개선을 수행하는 메커니즘을 규명하고, 최장 72시간 동안의 과제 수행 과정을 측정하는 오픈소스 벤치마크 '엣지벤치'를 공개했다.

  • AI 에이전트가 환경과 오래 상호작용할수록 성능이 가파르게 상승한 뒤 수렴하는 S자형성장 법칙을 따르며, 학습 효율이 3개월마다 2배씩 상승한다.
  • 장기 업무 수행 시 실패 로그와 빌드 오류를 잊지 않고 기억할 수 있는 대용량 컨텍스트 창(100만 토큰)이 학습의 핵심 하드웨어 요소로 확인되었다.
  • 엣지벤치 리더보드 12시간 기준 과제에서 클로드 오퍼스 4.8이 51.3점을 기록하며 GPT-5.5(48.4점)를 제치고 선두를 달리고 있다.
Notable Quotes & Details
  • 3일
  • 최대 72시간
  • 3개월마다 2배
  • 최소 12시간
  • 57.2시간
  • 320시간
  • 51개
  • 3만8000시간
  • 0.998
  • 99.8%
  • 43.0점
  • 36.1점
  • 247회
  • 7회
  • 100만
  • 20만
  • 97.8점
  • 81.5점
  • 51.3점
  • 48.4점
  • 2025년 9월
  • 2026년 5월
  • 89일
  • 30분

AI 연구원, 에이전트 개발자 및 AI 기술 트렌드 분석가

[7월3일] "비싼 모델만 쓸 필요 없다"…AI 토큰 비용 절감이 보여주는 변화

해외 AI 업계에서 토큰 비용을 절감하기 위해 모델 라우터, 멀티 프로바이더, 오케스트레이션, AI 핀옵스, 프롬프트 최적화 등 다양한 전략을 도입하여 운영 비용을 줄이고 있는 변화를 분석합니다.

  • AI 에이전트 도입에 따른 토큰 사용량 급증으로 기업들이 AI 비용을 관리하는 'AI 핀옵스(FinOps)'를 적용하기 시작함
  • 모델 라우터와 오케스트레이션 기술을 통해 단순 업무에는 저렴한 오픈소스 모델을, 복잡한 업무에만 고성능 모델을 매칭해 비용을 절감함
  • 오픈소스 모델의 성능 향상과 공급망 리스크 대응을 위해 여러 빅테크 및 오픈소스 모델을 조합해 쓰는 멀티 프로바이더 전략이 확산됨
Notable Quotes & Details
  • 팔란티어 이볼브(Evolve): GPT-5.4 나노 전환으로 컴퓨팅 비용 최대 97% 절감
  • 코그니션 데빈 퓨전(Devin Fusion): 운영 비용 35~41% 절감

기업의 AI 도입 및 운영 담당자, IT 기획자, 재무 관리자(FinOps 담당자)

샌드위치 체인 상장 서류에 'AI' 22번…저지 마익스 IPO 신청

미국 샌드위치 체인 저지 마익스의 뉴욕증권거래소 상장 신청 서류에 AI 관련 언급이 대거 포함된 사건을 통해 현재의 AI 열풍을 조명하고 있습니다.

  • 미국 2위 샌드위치 체인 저지 마익스가 뉴욕증권거래소에 상장을 신청했습니다.
  • 상장 서류에 '인공지능'과 'AI'라는 단어가 22차례 등장하며, 대부분은 AI 도입 실패 시의 투자 위험 고지 내용입니다.
  • 외신은 이를 두고 전통적인 요식업체의 상장 서류까지 AI로 채워지는 현상을 통해 AI 하이프(거품)가 얼마나 부풀었는지 보여주는 사례라고 평가했습니다.
Notable Quotes & Details
  • 7월 2일(현지시간)
  • 3,100곳
  • 80억 달러(약 12조 4천억 원)
  • 22차례

IT 및 비즈니스 트렌드, 특히 AI 열풍과 기업 IPO에 관심이 있는 대중

고도에서 새로운 디지털 실크로드 허브로: 제7회 서부 디지털 경제 박람회, 시안의 산업 융합이 강력한 모멘텀 발휘

시안에서 개최된 제7회 서부 디지털 경제 박람회가 성황리에 막을 내리며 시안의 디지털 산업 융합과 경제 성장 모멘텀을 입증했다.

  • 싱가포르, 한국 등 다국적 대표단과 중국 30여 개 도시, 119개 디지털 기업이 참가해 역대 최다인 34건의 핵심 프로젝트 계약을 체결했다.
  • 일대일로 파트너국 간 표준화된 디지털 무역을 위해 '실크로드 국경 간 데이터 흐름 및 운영 백서' 발표 및 자율규약을 체결했다.
  • 시안은 5대 신형 인프라 이니셔티브와 연구개발 센터 구축을 통해 디지털 산업 체인 클러스터를 형성하고 균형 잡힌 기업 생태계를 조성하고 있다.
Notable Quotes & Details
  • 6월 28일
  • 34건
  • 119개
  • 2025년 일정 규모 이상 핵심 디지털 경제 산업 규모는 1290억 위안(GDP의 9.28%)
  • 303건

글로벌 IT 및 디지털 경제 업계 관계자, 해외 진출을 모색하는 디지털 기업, 디지털 무역 및 기술 정책 연구원

주가 빠진 MS, 코파일럿 대수술…흩어진 AI 앱, 하나로 '통합'

마이크로소프트가 주가 하락과 코파일럿의 성장성 우려에 대응해 오는 8월 소비자용과 기업용 코파일럿을 하나로 통합하고 제품 전반을 실제 업무 중심으로 재편한다.

  • 마이크로소프트는 오는 8월 소비자용과 기업용 코파일럿을 하나로 통합하고, 성과가 부진한 코파일럿 팟캐스트 및 코파일럿 랩스 등의 기능들을 정리한다.
  • 상시 작동하며 사용자를 대신해 반복 업무를 처리하는 유료 신규 에이전트 기능인 '오토파일럿'을 통합 앱에 포함한다.
  • 이번 개편은 지난 3월 소비자·기업용 코파일럿 조직 통합 예고의 연장선이며, 제이콥 안드레우 수석부사장이 제품 전반을 총괄한다.
Notable Quotes & Details
  • 8월
  • 390.49달러
  • 20.6% 하락
  • 올해 1월 1500만 개에서 4월 2000만 개 이상
  • 5000만 명 이상
  • "MS는 AI가 무엇을 할 수 있는지뿐 아니라 이를 어떻게 써야 하는지에 대한 답을 내놓아야 한다"

IT 산업 종사자, 투자자, 기업용 및 개인용 AI 서비스 사용자

Jooojub
System S/W engineer
Explore Tags
Series
    Recent Post
    © 2026. jooojub. All right reserved.