Daily Briefing

June 29, 2026
2026-06-28
30 articles

Bringing more control over your connectors

Mistral AI가 외부 기업용 플랫폼과의 안전한 연동을 위해 어드민 제어 기능 강화, 커넥터 범위의 API 키, 다중 계정 지원, 디버거 및 워크플로우 지원 등 커넥터 관련 신규 보안 및 통제 기능을 발표했습니다.

  • 워크스페이스별 커넥터 접근 설정 및 개별 도구 활성화/비활성화를 지원하는 강화된 어드민 제어 기능 도입
  • 자동화된 AI 작업에서 제3자 시스템 연동 시 사칭을 방지하기 위한 커넥터 범위의 API 키 제공
  • MCP 커넥터의 엔드투엔드 근본 원인 분석을 위한 커넥터 디버거 및 단일 커넥터에 다중 계정 인증 기능 지원
Notable Quotes & Details

기업 시스템 관리자, AI 개발자 및 IT 보안 담당자

Workflows for work that runs the business

미스트랄 AI가 기업용 AI 프로세스의 안정적인 프로덕션 전환을 위한 오케스트레이션 레이어인 '워크플로우(Workflows)'의 퍼블릭 프리뷰를 출시했습니다.

  • 워크플로우는 노트북에서는 작동하지만 프로덕션에서 무음 실패하거나 네트워크 타임아웃을 버티지 못하는 등의 문제를 해결하기 위해 내구성, 관찰 가능성, 결함 허용성을 제공합니다.
  • 개발자는 파이썬으로 워크플로우를 작성하고 이를 Le Chat에 게시하여 조직 내 누구나 실행할 수 있도록 하며, 모든 단계는 Studio에서 추적 및 감사할 수 있습니다.
  • wait_for_input()과 같은 한 줄의 코드로 워크플로우를 일시 중지하고 사람의 승인을 대기하도록 구현할 수 있으며, 글로벌 해운 문서 검증 및 KYC 프로세스 등에 이미 활용되고 있습니다.
Notable Quotes & Details
  • ASML, ABANCA, CMA-CGM, France Travail, La Banque Postale, Moeve
  • wait_for_input()

기업의 AI 애플리케이션 개발자, IT 운영자 및 비즈니스 프로세스 자동화를 고려하는 엔터프라이즈 팀

Introducing Forge

Mistral AI가 기업들이 자체 보유한 데이터, 문서, 코드베이스 등을 학습시켜 고유의 도메인 지식과 워크플로우를 이해하는 맞춤형 AI 모델을 구축할 수 있도록 지원하는 시스템인 Forge를 출시했습니다.

  • Forge는 기업 내부의 독점 지식과 규정, 워크플로우를 반영한 프론티어급 AI 모델 구축 시스템입니다.
  • 사전 학습(Pre-training), 사후 학습(Post-training), 강화 학습(Reinforcement learning) 등 모델 생애주기 전반에 걸친 현대적인 학습 방식을 지원합니다.
  • 기업이 자체 인프라 환경에서 모델을 학습시키고 제어함으로써 데이터 주권과 지식 재산권(IP), 규제 준수성을 확보할 수 있습니다.
Notable Quotes & Details
  • ASML
  • DSO National Laboratories Singapore
  • Ericsson
  • European Space Agency
  • Home Team Science and Technology Agency (HTX) Singapore
  • Reply

자체 보안 데이터와 전문 지식을 기반으로 맞춤형 AI 모델 및 에이전트를 구축하려는 기업 고객 및 개발자

Mistral AI partners with NVIDIA to accelerate open frontier models

미스트랄 AI와 엔비디아가 협력하여 개방형 프론티어 인공지능 모델의 개발을 가속화하기 위해 엔비디아 네모트론 연합을 결성하고 공동 연구 및 모델을 배포한다.

  • 미스트랄 AI는 엔비디아 네모트론 연합(NVIDIA Nemotron Coalition)의 창립 멤버로 참여하여 프론티어 오픈소스 AI 모델을 공동 개발한다.
  • 양사는 미스트랄 AI의 특화된 모델 아키텍처 및 풀스택 플랫폼과 엔비디아의 컴퓨팅 자원 및 합성 데이터 생성 파이프라인을 결합한다.
  • 미스트랄 AI는 전 세계 개발자들을 지원하기 위해 새로운 개방형 모델인 Mistral Small 4를 출시했다.
Notable Quotes & Details
  • Mistral Small 4
  • “Open frontier models are how AI becomes a true platform,” said Arthur Mensch, cofounder and CEO of Mistral AI.
  • NVIDIA DGX Cloud
  • NVIDIA Nemotron 4

AI 개발자, 연구원 및 기업 고객

Leanstral: Open-Source foundation for trustworthy vibe-coding

Mistral AI가 Lean 4 증명 보조기를 위한 최초의 오픈소스 코드 에이전트인 Leanstral을 출시했습니다.

  • Leanstral은 단순한 수학 문제 풀이를 넘어 실제 공식 소프트웨어 저장소 및 명세 검증을 위해 설계된 6B 활성 파라미터 규모의 고효율 오픈소스 코드 에이전트입니다.
  • Apache 2.0 라이선스로 가중치가 공개되며, Mistral vibe의 에이전트 모드 및 무료 API 엔드포인트를 통해 제공됩니다.
  • FLT 프로젝트의 PR을 기반으로 한 벤치마크(FLTEval)에서 Leanstral-120B-A6B는 훨씬 더 큰 대규모 오픈소스 모델들(GLM5, Kimi-K2.5 등)보다 뛰어난 효율성과 성능을 입증했습니다.
Notable Quotes & Details
  • Lean 4
  • 6B active parameters
  • Apache 2.0
  • FLTEval
  • lean-lsp-mcp
  • Claude Opus 4.6, Sonnet 4.6, Haiku 4.5
  • Qwen3.5 397B-A17B, Kimi-K2.5 1T-A32B, GLM5 744B-A40B
  • Leanstral-120B-A6B
  • GLM5-744B-A40B
  • Kimi-K2.5-1T-32B
  • 16.6
  • 20.1

소프트웨어 검증 엔지니어, 수학 연구자, AI 개발자 및 오픈소스 인공지능 커뮤니티

California will tax downloaded software for the first time as part of a $351.7 billion budget deal

캘리포니아주가 세수 확보를 위해 최초로 다운로드 소프트웨어에 소비세를 부과하고, AI 기업 IPO로 인한 횡재 대비 예치금을 늘리는 내용의 3,517억 달러 규모 예산안에 합의했습니다.

  • 캘리포니아 주정부와 의회가 웹에서 다운로드하는 기성 소프트웨어에 소비세를 확대 적용하는 예산안에 합의했습니다.
  • 이번 소프트웨어 세금 부과를 통해 2028 회계연도부터 주정부 9억 달러, 지방정부 11억 달러 등 매년 총 20억 달러의 추가 세수가 확보될 것으로 예상됩니다.
  • OpenAI나 Anthropic 등 캘리포니아 기반 AI 기업들의 IPO에 따른 수익 급증 시 더 많은 예산을 적립할 수 있도록 하는 법안이 11월 주민투표에 부쳐질 예정입니다.
Notable Quotes & Details
  • 351.7B
  • 2B
  • 900 million
  • 1.1 billion
  • 2028
  • June 18
  • Most of us don’t get prewritten software on a physical disc anymore. The whole world is past that, our tax code isn’t
  • For millions of Californians, this isn’t abstract. This impacts real people, real businesses. This tax could be the difference between making payroll and missing it
  • 35.2 billion
  • 4.5 billion
  • 90 million
  • 250 million
  • 3 billion
  • 2030
  • 5 million
  • 70%

IT 기업 관계자, 소프트웨어 소비자, 세법 및 공공 정책 분석가

The BIS warns an AI bust could hit credit markets as hard as the 2008 financial crisis

국제결제은행(BIS)이 연례 보고서를 통해 AI 투자 붐이 붕괴할 경우 2008년 금융위기 수준으로 신용 시장에 큰 타격을 줄 수 있다고 경고했습니다.

  • BIS는 AI 투자 수익에 대한 실망감이 자금 조달의 갑작스러운 회수로 이어져 투자 붐이 장기적인 침체로 전환되고 금융 시장에 연쇄 충격을 줄 수 있다고 지적했습니다.
  • 반도체 제조업체와 하이퍼스케일러가 AI 랩에 지분을 투자하고, 이들이 다시 투자자의 칩이나 컴퓨팅 파워를 구매하는 '순환 금융' 구조의 취약성과 불투명성을 경고했습니다.
  • 현재 AI 주식의 집중도는 닷컴 버블 시절을 넘어섰으며, S&P 500 지수 상위 10개 기업이 인덱스의 36%에서 40%를 차지하고 있습니다.
Notable Quotes & Details
  • 2008
  • 36%
  • 40%
  • Disappointment in returns could trigger a sudden pullback in financing and turn the capex boom into a protracted investment bust, with potential knock-on effects on financial conditions

금융 규제 당국, 기관 투자자, 경제 정책 입안자 및 금융 시장 참여자

Auto repair is one of the least digitised industries in America. AI is changing the economics of why.

미국 내 대표적인 아날로그 산업인 자동차 정비업계에 AI 기반 소프트웨어가 도입되며 시장 구조와 경제성이 변화하고 있습니다.

  • 북미 28만여 개의 자동차 정비소는 여전히 전화 예약, 종이 주문서 등 1990년대 수준의 수동 작업 방식으로 운영되어 왔으나 AI의 도입으로 데이터 입력 부담이 사라지면서 디지털화가 빠르게 진행되고 있습니다.
  • 업계의 가장 큰 문제인 40% 이상의 전화 미수신율을 해결하기 위해 24시간 예약 및 후속 조치가 가능한 AI 접객 서비스가 도입되어 즉각적인 매출 향상으로 이어지고 있습니다.
  • 수요 예측 일정 관리와 자동 고객 관리 등 AI 기반 운영을 통해 정비소당 계약 가치가 상승하고 있으며, 사모펀드(PE)의 정비소 인수합병(Rollup) 활성화와 함께 소프트웨어 도입도 가속화되고 있습니다.
Notable Quotes & Details
  • 280,000 US auto repair shops
  • $3.4 billion in 2026 to $8.6 billion by 2033
  • 14.2% CAGR
  • missed-call rates above 40%

자동차 정비 업계 종사자, 수직적 AI(Vertical AI) 분야 스타트업 창업자 및 벤처캐피털 투자자

Google is rationing Gemini access to Meta because it cannot provide enough compute

구글이 연산 능력(컴퓨트) 부족으로 인해 메타의 제미나이 AI 모델 사용량을 제한함에 따라 메타가 자체 AI 모델 전환을 가속화하고 있습니다.

  • 구글이 컴퓨팅 용량 부족을 이유로 메타 등 주요 고객사의 제미나이 AI 모델 접근량을 제한했습니다.
  • 메타는 제미나이 의존도를 줄이기 위해 안전 프로세스 등의 업무를 자체 개발한 새로운 내부 모델인 '뮤즈 스파크(Muse Spark)'로 이전하고 있습니다.
  • AI 인프라 구축 속도가 소비량을 따라가지 못해 구글이 스페이스X로부터 엔비디아 GPU를 임대하는 등 업계 전반에 물리적 컴퓨트 병목 현상이 발생하고 있습니다.
Notable Quotes & Details
  • 구글은 제미나이 엔터프라이즈 수요를 맞추기 위해 스페이스X에 엔비디아 GPU 110,000개 사용 대가로 매달 9억 2천만 달러(920 million)를 지불하기로 합의했습니다.
  • 구글은 올해 자본지출(capex)에 1,800억 달러(180 billion) 이상을 지출하고 있습니다.
  • 메타는 2026년 자본지출 가이드라인을 1,150억~1,350억 달러(115 to 135 billion)로 제시하고, 5월에 8,000명의 직원을 감축하며 AI 부서에 7,000명을 재배치했습니다.

AI 비즈니스 동향 및 IT 인프라 산업에 관심이 있는 독자층

India’s payments chief says AI will drive UPI from 750 million to a billion daily transactions

인도 결제공사(NPCI) CEO가 AI 기술을 활용하여 통합결제인터페이스(UPI)의 일일 거래량을 7억 5천만 건에서 10억 건으로 끌어올릴 것이라고 밝혔다.

  • AI는 사기 예방, 신용 분배, 다국어 음성 온보딩을 통해 UPI의 차세대 사용자 유입을 견인할 것이다.
  • 인도 결제 시장은 PhonePe와 Google Pay가 80% 이상의 점유율을 차지하고 있어 독과점 해소를 위한 규제가 논의 중이다.
  • NPCI CEO인 Dilip Asbe는 인도 핀테크 생태계가 정밀하고 명확한 소형 언어 모델(SLM)을 구축할 큰 기회를 가지고 있다고 강조했다.
Notable Quotes & Details
  • 750 million
  • a billion
  • 80%+
  • 2023
  • 1%
  • December 31, 2026
  • "AI will be used very effectively when we look at the next wave of UPI, and that includes all aspects, including reaching new users,"
  • "We have a very rich data set in our ecosystem, I think there is a big opportunity for Indian companies, the banks, FinTechs, and the ecosystem, to create small language models which are sharp, specific, and as deterministic as possible."

핀테크 산업 종사자, 금융 기술 투자자 및 AI와 인도 결제 시장 동향에 관심이 있는 IT 전문가

Prosecutors used ChatGPT logs as evidence in the Palisades fire trial

검찰이 팰리세이즈 산불 방화 재판에서 피고인의 ChatGPT 대화 기록을 증거로 사용했으나 배심원들을 설득하지 못해 미심결 처리되었습니다.

  • 검찰은 피고인 Jonathan Rinderknecht의 방화 혐의를 입증하기 위해 iPhone 위치 데이터, CCTV 영상 등과 함께 ChatGPT 대화 기록을 증거로 제시했습니다.
  • ChatGPT 기록에는 불 이미지 생성 요청, 분노에 대한 질문, 부유층에 대한 불만 토로 및 담배로 시작된 화재의 책임 여부를 묻는 질문 등이 포함되어 있었습니다.
  • 배심원단은 10대 2로 무죄 의견이 우세하여 평결 불일치(결열) 상태로 미심결이 선언되었으며, 한 배심원은 평범한 챗봇 사용을 성격적 결함으로 몰아가는 검찰의 유도에 분노했다고 밝혔습니다.
Notable Quotes & Details
  • 2025년 새해 첫날
  • 10-2
  • “I talk to ChatGPT all the time.”

AI 기술의 법적 증거 활용 사례 및 사법 체계의 기술 이해도에 관심이 있는 일반 독자

Building a Stable Fable 5 Traces Workflow in Colab: Parsing Tool Calls, Auditing Data, and Training Baselines

Hugging Face의 Fable 5 Traces 데이터셋을 활용하여 의존성을 최소화하고 코딩 에이전트의 트레이스 데이터를 분석, 정제, 시각화하며 나이브 베이즈 모델을 학습시키는 Colab 워크플로우 구축 튜토리얼이다.

  • datasets, scikit-learn, scipy 등의 무거운 라이브러리 대신 huggingface_hub, rich, tqdm 등 가벼운 환경 설정으로 Colab의 의존성 안정성을 확보했다.
  • merged JSONL 파일을 직접 다운로드 및 파싱하여 툴 호출 규격화, 텍스트 출력 정규화, 비밀번호 및 API 키 등의 잠재적 유출 패턴(secret-like patterns)을 검사하는 데이터 감사 기능을 구현했다.
  • SFT 학습에 사용할 수 있는 안전한 no-CoT 대화 데이터를 내보내고, 텍스트 분류와 툴 사용 예측을 위해 순수 파이썬으로 구현한 나이브 베이즈 베이스라인 모델을 학습시킨다.
Notable Quotes & Details
  • Glint-Research/Fable-5-traces
  • fable5_cot_merged.jsonl
  • 0.23.0
  • 13.0.0
  • 4.66.0

코딩 에이전트 트레이스 데이터를 다루고 Colab에서 데이터 파이프라인 및 모델 학습 워크플로우를 안정적으로 구축하려는 AI 개발자 및 연구자

Liquid AI Ships LFM2.5-230M with llama.cpp, MLX, vLLM, SGLang, and ONNX Support for On-Device Inference

Liquid AI가 온디바이스 추론 및 에이전트 작업을 위해 다양한 도구를 지원하는 자사 최소형 모델 LFM2.5-230M을 출시했습니다.

  • Liquid AI의 LFM2.5-230M은 LFM2 아키텍처를 기반으로 한 2억 3천만 매개변수 규모의 최소형 오픈 가중치 텍스트 모델입니다.
  • Galaxy S25 Ultra에서 213 tok/s, Raspberry Pi 5에서 42 tok/s의 속도로 온디바이스에서 실행되며, llama.cpp, MLX, vLLM 등을 지원합니다.
  • 지시사항 이행(IFEval) 및 데이터 추출 벤치마크에서 Qwen3.5-0.8B 및 Gemma 3 1B 등의 더 큰 모델들을 능가하지만, 수학, 코드 생성, 창작 분야에는 적합하지 않습니다.
Notable Quotes & Details
  • 230M params
  • 213 tok/s on a Galaxy S25 Ultra
  • 42 tok/s on a Raspberry Pi 5
  • IFEval: LFM2.5-230M (71.71) vs Qwen3.5-0.8B (59.94) vs Gemma 3 1B IT (63.49)
  • 293–375 MB footprint

모바일, 로봇 및 하드웨어 엣지 단에서 지시 수행 및 데이터 추출 기능을 개발하는 임베디드 AI/에이전트 개발자

Show GN: ArachneControl – 서버가 브라우저를 원격 제어해 수집하는 오픈소스 데이터 수집 시스템

서버가 사용자의 실제 브라우저 세션을 원격 제어하여 보안 및 로그인 장벽을 우회하고 동적으로 데이터를 수집하는 오픈소스 self-hosted 시스템 ArachneControl에 대한 소개입니다.

  • 로그인된 사용자 브라우저를 통해 수집을 수행하여 타겟 백엔드 부하와 로그인 차단 벽을 피하는 Zero-Footprint 설계를 가집니다.
  • 수집 규칙을 서버가 런타임에 동적으로 발행하므로 클라이언트를 재배포할 필요가 없습니다.
  • WebUI에서 요소를 클릭하여 선택기와 액션 시퀀스 레시피를 작성할 수 있고, 안전을 위해 script eval을 금지합니다.
Notable Quotes & Details
  • ENABLE_TUNNEL=1

웹 데이터 수집 시스템 및 크롤러 개발자, QA 디버깅 및 오픈소스 도구 관심 개발자

DSpark: Speculative decoding을 활용한 LLM 추론 가속화 [pdf]

준자기회귀 생성과 신뢰도 스케줄링을 결합하여 기존 병렬 드래프터의 한계를 극복하고 LLM 추론을 가속화하는 speculative decoding 프레임워크인 DSpark에 대한 기사입니다.

  • 병렬 백본에 경량 순차 모듈을 결합하는 준자기회귀 구조를 통해 블록 내부 의존성을 주입하여 후반부 수락률 급감 문제를 해결했습니다.
  • 신뢰도 헤드가 위치별 생존 확률을 추정하고 하드웨어 인지 스케줄러가 엔진 처리량에 맞춰 검증 길이를 동적으로 조정하여 검증 낭비를 억제합니다.
  • DeepSeek-V4 실서비스 배포 시 동일 처리량 환경에서 기존 production baseline인 MTP-1 대비 사용자별 생성 속도를 60–85% 가속하였습니다.
Notable Quotes & Details
  • 60–85%

LLM 추론 최적화 및 인프라 서빙 효율화에 관심이 있는 AI 엔지니어 및 시스템 개발자

Paca - 인간과 AI 에이전트 협업을 위한 오픈소스 프로젝트 관리 도구

인간과 AI 에이전트의 협업을 지원하는 오픈소스 셀프 호스팅 프로젝트 관리 플랫폼 Paca에 대한 소개

  • AI 에이전트를 단순 챗봇이 아닌 Scrum 팀의 동등한 팀원으로 참여시켜 인간과 함께 스프린트 및 Scrumban 보드에서 협업하게 함
  • MCP 서버 및 Claude Code 등을 통해 에디터를 벗어나지 않고 자연어 명령으로 작업, 문서, 스프린트를 관리함
  • OpenHands SDK 기반 에이전트와 WebAssembly 플러그인을 사용하여 안전하고 격리된 샌드박스 환경에서 실행됨
Notable Quotes & Details
  • P-A-C-A 사이클(Plan → Act → Check → Adapt)

개발자, 프로젝트 매니저, DevOps 엔지니어 및 AI 협업 도구에 관심 있는 IT 커뮤니티 구성원

Reddit 안티스팸 내부를 엿보다

2021년 Reddit의 일시적인 시스템 오류로 인해 외부 앱에서 비공개로 취급되어야 할 안티스팸 내부 제거 사유 및 작동 데이터가 노출되었던 분석 사례입니다.

  • Relay for reddit 앱의 코드 처리 경로와 Reddit API 오류가 겹치며 비공개 안티스팸 내부 데이터가 노출되었습니다.
  • 노출된 스팸 차단 사유에는 도메인 차단, spammit 확률 점수, shadowban 내역 외에도 spamurai 시스템 등이 확인되었습니다.
  • Reddit 안티스팸 시스템은 Python 2.7 기반 검사, Lua 규칙, Snooron, 이미지 분류 도구 및 Google Perspective API가 혼합된 다세대 시스템으로 파악됩니다.
Notable Quotes & Details
  • 2021년
  • 39.71%
  • 98.19%
  • 2017년
  • 2026년

IT 보안 및 웹 서비스 개발자, 스팸 차단 시스템 설계에 관심이 있는 개발자

NLnet Labs의 LLM 사용 정책

NLnet Labs가 프로젝트 기여 및 커뮤니케이션에서 LLM 사용을 엄격히 제한하고 인간 개발자의 검증과 책임을 강조하는 정책을 도입했다.

  • 코드와 문서 기여는 반드시 사람이 직접 작성해야 하며, LLM이나 다른 확률적 도구가 생성한 내용은 포함할 수 없다.
  • 이슈, 취약점 보고, 커뮤니티 포럼 게시 등 NLnet Labs와 상호작용할 때는 LLM 사용 여부를 투명하게 공개해야 한다.
  • 규칙의 주된 배경은 생성된 코드의 검토 및 장기 유지보수 부담이 팀에 전가되는 것을 막고, 개발자들의 시간을 보호하기 위함이다.
Notable Quotes & Details
  • sep@nlnetlabs.nl
  • 1만 줄 코드

오픈소스 프로젝트 기여자 및 개발자

NagaTranslate: Building a translation and voice pipeline for low-resource Nagaland creoles (Whisper, VITS, LLMs) [P]

인도 나갈랜드 지방의 자원 부족 언어인 나가미즈어, 아오어, 세마어를 위한 번역 및 음성 처리 파이프라인 개발기이자 기술적 한계에 대한 조언 요청입니다.

  • 텍스트 번역을 위해 초기에는 미세조정된 NLLB 모델을 사용했으나 자연스러운 대화 흐름을 위해 현재는 상용 LLM API와 퓨샷 프롬프팅을 활용하고 있습니다.
  • 음성 합성(TTS)에는 자체 나가미즈어 음성 데이터로 미세조정한 VITS 모델을, 음성 인식(ASR)에는 Whisper 모델을 미세조정하여 Hugging Face Spaces ZeroGPU에 호스팅하고 있습니다.
  • 표준화되지 않은 철자 변형 처리, 소규모 데이터셋에서의 지역 방언 및 액센트 인식 강인함 확보, 상용 API에서 비용이 적게 드는 자체 호스팅 오픈 가중치 모델로의 전환이 주요 도전 과제입니다.
Notable Quotes & Details
  • Nagamese, Ao, and Sema
  • No Language Left Behind
  • Hugging Face Spaces ZeroGPU

저자원 언어 처리(NLP), 음성 인식 및 합성 기술 개발에 관심이 있는 AI 연구원 및 개발자

I shrank a transformer until every number fitted on the screen and made the weights editable [R]

LLM의 작동 원리를 이해하기 위해 모든 수치를 화면에 표시하고 가중치를 직접 수정할 수 있도록 축소한 트랜스포머 시각화 웹페이지를 개발했습니다.

  • 어휘 크기 6개, 임베딩 차원 3차원의 초소형 트랜스포머 모델을 통해 4개 단어를 입력받아 다음 단어를 예측하는 전 과정을 시각화함
  • 가중치와 단어 벡터를 직접 편집할 수 있으며, 수정 시 하류의 모든 연산 결과가 실시간으로 재계산됨
  • 외부 라이브러리나 빌드 단계 없이 단일 HTML 파일로 구현되었으며 역전파(학습) 과정은 생략됨
Notable Quotes & Details
  • https://dgochin.github.io/transformer/

트랜스포머와 LLM의 수학적/행렬 연산 작동 원리를 밑바닥부터 이해하고자 하는 개발자 및 학습자

We have Mythos at Home: GLM 5.2 beats Claude in our Cyber Benchmarks

Zhipu AI의 오픈웨이트 모델인 GLM 5.2가 Semgrep의 IDOR 벤치마크 테스트에서 Claude Code를 제치고 우수한 성능을 보여주었다는 내용입니다.

  • Zhipu AI의 GLM 5.2 모델이 IDOR 탐지 테스트에서 39%의 F1 스코어를 기록하며 Claude Code(32%)를 능가했습니다.
  • 취약점 탐지 성능에서 모델 자체의 역량과 이를 둘러싼 하네스(Scaffolding)의 역할 비중을 파악하기 위한 실험 중 발생한 결과입니다.
  • GLM 5.2는 2026년 6월 13일에 공개되어 MIT 라이선스 하에 오픈웨이트로 배포되어 보안 팀이 자체 하드웨어에서 실행 및 파인튜닝할 수 있는 장점이 있습니다.
Notable Quotes & Details
  • 39% F1 on IDOR detection
  • Claude Code (32%)
  • roughly $0.17 per vulnerability found
  • Semgrep's multimodal pipeline (53–61% F1)
  • June 13, 2026
  • June 16

보안 연구원, AI 모델 평가자, 보안 도구 개발자 및 IT 커뮤니티

Use Android Auto? How to limit what information Gemini learns about you

안드로이드 오토에 통합된 제미나이의 개인정보 수집 방식과 이를 제한할 수 있는 개인정보 보호 설정 방법을 안내합니다.

  • 안드로이드 오토에서 제미나이를 완전히 비활성화하는 것은 불가능하지만 일부 설정을 통해 수집 정보를 제한할 수 있습니다.
  • 상시 대기 중인 마이크로 인한 음성 정보 유출이 우려되는 경우, 설정에서 상시 듣기 기능을 끄고 스티어링 휠 버튼으로만 제미나이를 활성화하도록 변경할 수 있습니다.
  • 스마트폰 설정의 안드로이드 오토 권한 메뉴에서 통화 기록, 문자, 연락처 등의 접근 권한을 개별적으로 선택하여 제한할 수 있습니다.
Notable Quotes & Details

안드로이드 오토 및 제미나이의 개인정보 수집에 대해 우려하는 일반 사용자

국내 AI 업계, 마누스 외면… "중국산 거부감보다 대체재 풍부"

국내 AI 업계가 보안 우려와 풍부한 대체재로 인해 중국계 AI 에이전트 서비스 '마누스' 도입에 부정적인 반응을 보이고 있다.

  • 국내 AI 기업들은 클로드, 챗GPT 등 기존 미국계 서비스가 시장을 선점하고 있어 마누스 도입 필요성을 느끼지 못하고 있다.
  • 중국계 서비스 특유의 데이터 유출 우려와 불안정한 시스템, 빠른 크레딧 소모 등의 기술적 한계가 지적된다.
  • 직관적인 인터페이스와 시각화된 에이전트 구동 과정 덕분에 비개발자 직군의 시장 리서치 등 일부 업무에서만 긍정적 평가를 받았다.
Notable Quotes & Details
  • 10여 곳
  • 제2의 딥시크로 주목받아 내부 테스트를 진행했으나, 이미 클로드 등 사용성이 뛰어난 대체재가 많아 마누스만의 확실한 차별성을 찾지 못했다

국내 AI 업계 관계자 및 기술 트렌드에 관심 있는 일반 독자

장시간 컴퓨터 사용 능력 벤치마크 공개…'오퍼스 4.8' 최고점

AI 연구소 X랭이 실제 전문가 수준의 장시간 컴퓨터 업무 수행 능력을 평가하는 벤치마크인 'OS월드 2.0'을 공개했다.

  • 장시간에 걸친 실제 컴퓨터 업무 수행 능력을 평가하는 새로운 벤치마크인 OS월드 2.0이 공개되었다.
  • 숙련된 사람이 평균 1.6시간 걸리는 총 108개 과제를 기반으로 하며, 클로드 오퍼스 4.8이 20.6%의 완수율로 최고점을 기록했다.
  • AI 에이전트는 복잡한 장기 업무를 수행할 때 제약 조건을 잊거나 중간 정보를 놓치고 검증을 누락하는 등 한계를 보였다.
Notable Quotes & Details
  • 26일(현지시간)
  • 평균 1.6시간
  • 108개 과제
  • 7개 전문 분야와 21개 세부 분야
  • 평균 27.25개의 체크포인트
  • 평균 318회의 도구 호출
  • 500단계의 작업 예산 기준
  • 20.6%
  • 54.8%
  • 약 13%

AI 연구자, AI 에이전트 개발자, 기술 업계 종사자

딥시크, LLM 추론 속도 최대 85% 높이는 ‘D스파크’ 오픈소스 공개

딥시크가 LLM 추론 성능을 크게 높여주는 오픈소스 추측형 디코딩 프레임워크인 D스파크를 공개했다.

  • 병렬 방식의 빠른 속도와 자기회귀 방식의 높은 문맥 일관성을 결합한 반 자기회귀 구조를 도입했다.
  • GPU 부하에 따라 한 번에 검증할 토큰 수를 자동으로 조절하는 신뢰도 기반 검증 기능을 추가했다.
  • 목표 모델의 가중치를 고정한 채 초안 모델 등 일부 구성 요소만 학습하여 품질을 유지하면서 성능을 개선했다.
Notable Quotes & Details
  • 26일
  • 85%
  • D스파크(DSpark)
  • 딥스펙(DeepSpec)
  • 사용자당 생성 속도가 Flash 모델은 60~85%, Pro 모델은 57~78% 향상

인공지능 모델 개발자 및 LLM 서비스 최적화 엔지니어

에포크 AI, '장기 개발 능력' 벤치마크 공개...“코드 암기론 통과 못해”

에포크 AI가 AI 모델의 장기 소프트웨어 개발 능력을 평가하기 위해 인터넷이나 원본 소스코드 없이 프로그램 전체를 재구현하도록 하는 벤치마크 '미러코드'를 공개했다.

  • 기존의 단기 작업 평가와 달리 미러코드는 원본 코드 없이 프로그램 전체를 처음부터 다시 구현하는 장기 소프트웨어 개발 능력을 측정한다.
  • 충분한 추론 예산을 제공하며, 최신 모델 중 클로드 오퍼스 4.7은 56%의 성공률을 기록하는 등 빠른 성능 향상을 보였으나 모든 과제를 해결한 모델은 없다.
  • 평가 프레임워크와 25개 과제 중 22개 프로그램을 깃허브를 통해 오픈소스로 공개하고 3개는 비공개 테스트 세트로 유지한다.
Notable Quotes & Details
  • 26일(현지시간)
  • 25개 프로그램
  • 19일
  • 2600달러
  • 클로드 오퍼스 4.7
  • 1만6000줄의 고(Go) 코드
  • 40개 이상의 명령어
  • 고트리(gotree)
  • 2~17주
  • 14시간
  • 251달러(약 38만6000원)
  • 56%
  • 90% 이상
  • 30%
  • GPT-5.5
  • GPT-5
  • 클로드 오퍼스 4.1
  • 6개 프로그래밍 언어
  • 132개 과제
  • 22개 프로그램

AI 연구자, 소프트웨어 엔지니어, AI 모델 개발사

KAIST, AI의 '디지털 연령차별' 정량 분석..."생성 AI의 은밀한 연령 편향"

KAIST 연구진이 생성 AI(GPT-4o)의 답변에 내재된 고령층에 대한 연령 고정관념과 편향을 정량적으로 분석하여 규명했다.

  • GPT-4o가 생성한 텍스트를 사회심리학의 고정관념 내용 모델로 분석한 결과, 60세 이상 고령자 집단은 '따뜻함' 점수는 높으나 '역량' 점수는 낮게 나타났다.
  • 70대 이상 고령층에 대해서 획일적인 묘사가 반복되었으며, 연령이 높아질수록 자신감과 주도성을 나타내는 '자기주장성' 표현 빈도가 감소했다.
  • 이러한 AI의 편향적 묘사가 지속적으로 노출될 경우 고령자에 대한 사회적 편견을 강화하고 디지털 연령차별로 이어질 우려가 있다.
Notable Quotes & Details
  • GPT-4o
  • 28일
  • 10세부터 90세까지
  • 900개
  • 최문정 교수: "AI의 편향은 기술의 문제가 아니라 사회의 문제이며, 포용적 인공지능을 위해 다양한 세대가 개발 과정에 참여해야 한다"
  • 더 제론톨로지스트 2026년 2월호 특별호

AI 개발자, 사회과학 연구자, 기술 정책 수립자 및 생성형 AI 편향 문제에 관심이 있는 대중

SGA솔루션즈 레드캐슬, CC인증 EAL4 획득

SGA솔루션즈의 서버 보안 솔루션인 레드캐슬 V6.0이 CC인증 EAL4 등급을 획득하여 공공 및 금융, 대기업 보안 시장 공략을 강화한다.

  • SGA솔루션즈의 '레드캐슬 V6.0 for Windows Server 2025 R3'가 국제 표준 CC인증 EAL4 등급을 획득함
  • 이 제품은 OS 커널 수준의 접근 통제와 마이크로세그멘테이션 기반 내부 네트워크 접근제어로 횡적 이동 공격을 차단함
  • SGA솔루션즈는 이번 인증을 통해 국가 망 보안체계와 제로트러스트 대응 공공 시장을 강화하고 금융 및 대기업 시장으로 확장을 도모함
Notable Quotes & Details
  • 레드캐슬(RedCastle) V6.0 for Windows Server 2025 R3
  • EAL4
  • 국가용 보안요구사항 V3.0
  • Windows Server 2025
  • “AI와 클라우드 중심의 IT 환경에서는 데이터 가치가 더 높아지기 때문에 서버 단위 보안 통제와 마이크로세그멘테이션이 선택이 아닌 필수 요소로 자리 잡고 있다"

공공 기관, 금융권, 대기업의 보안 관리자 및 IT 인프라 운영자

한국데이터산업진흥원 "데이터로 중소·소상공인 지원"

한국데이터산업진흥원이 중소기업과 소상공인의 데이터 활용을 지원하기 위해 생성형 AI와 AI 에이전트 기술을 접목한 'AI·데이터 문제해결은행' 서비스 고도화를 추진하여 12월경 선보인다.

  • 생성형 AI와 AI 에이전트 기술을 접목하여 자연어 질문이나 데이터 업로드만으로 문제 진단부터 실행 전략 도출까지 지원하는 대화형 분석 서비스를 구현한다.
  • 내부 DB와 레시피 저장소, 외부 시스템을 MCP(Model Context Protocol) 표준 프로토콜 기반으로 실시간 연계하고 오케스트레이터 기반 구조로 동작하게 한다.
  • 2026년 서비스 개편을 통해 사용자가 복잡한 분석 도구 없이 직관적인 분석 결과와 시각화 자료를 받아볼 수 있는 실행형 AX 서비스로 전환한다.
Notable Quotes & Details
  • 2026년 AI·데이터 문제해결은행 운영·기능 고도화
  • 12월경 서비스
  • 활용사례 2460건과 데이터레시피 1248건을 포털에 제공
  • 올해는 추가적으로 활용사례 900여건과 AI·데이터레시피 1200여건을 확보할 예정
  • 올해 11월까지 고도화 추진
  • 양재수 한국데이터산업진흥원장: "복잡한 통계 지식이 없는 중소기업과 소상공인도 검증된 분석 흐름을 따라 필요한 의사결정 정보를 손쉽게 확보할 수 있다"

데이터 활용 및 비즈니스 현안 해결에 어려움을 겪는 중소기업, 스타트업, 소상공인

스페이스X가 직접 이통사 운영한다..."주파수 경매 참여”, "종이호랑이 전락”

스페이스X가 미국 주파수 경매에 참여하며 독자적인 이동통신 사업 진출 가능성을 내비쳐 업계의 이목이 쏠리고 있다.

  • 스타링크의 독자 이통사 진출설은 기네 쇼트웰 스페이스X COO가 IPO 로드쇼에서 투자자들에게 언급하면서 부각되었다.
  • 스페이스X는 미국 AWS-3 주파수 경매에서 신시내티와 멕시코만 지역 주파수를 낙찰받아 독자 사업 추진 의구심을 키웠다.
  • 일각에서는 독자 지상망 구축보다 스마트폰과 블루투스·와이파이로 연결되는 휴대용 라우터 형태의 사업이거나 협상용 카드일 가능성을 제기하고 있다.
Notable Quotes & Details
  • AWS-3
  • 스타링크 미니
  • 종이호랑이(paper tiger)

이동통신 및 우주 테크 산업 관계자와 스페이스X 투자자

Jooojub
System S/W engineer
Explore Tags
Series
    Recent Post
    © 2026. jooojub. All right reserved.