Daily Briefing

June 25, 2026
2026-06-24
63 articles

Inside Microsoft’s two-decade push to cut water intensity while scaling for growth

마이크로소프트가 클라우드 및 AI 서비스 수요 급증에 대응하며 데이터센터의 물 사용 집약도를 낮추고 2030년 워터 포지티브 목표를 달성하기 위해 추진해 온 지난 20년간의 수자원 관리 성과와 기술 혁신을 소개하고 있다.

  • 2000년대 초반 첫 데이터센터 구축 이후 냉각 기술 혁신 등을 통해 물 사용 효율성(WUE)을 약 90% 개선하여 평균 WUE를 2.3 L/kWh에서 2025년 기준 0.27 L/kWh로 낮췄다.
  • 2030년까지 데이터센터 물 사용 집약도를 40% 개선한다는 목표 아래, 2025년 기준으로 이미 25% 감축을 달성하여 목표치 절반을 넘어섰다.
  • 2025 회계연도(FY25)에 글로벌 사업 전체적으로 취수한 물보다 더 많은 물을 환원하는 '워터 포지티브(Water Positive)' 이정표를 달성했으며, 2024년에는 운영 중 냉각에 물을 전혀 사용하지 않는 AI 최적화 신규 데이터센터 설계를 도입했다.
Notable Quotes & Details
  • 2030
  • 90%
  • 2.3 L/kWh
  • 0.27 L/kWh
  • 2025
  • 40 percent
  • 25 percent
  • FY25
  • 2008
  • 85°F (29.4°C)
  • 2024

IT 인프라 및 친환경 기술 투자자, 지속 가능한 기업 경영 관심층, 데이터센터 지역 사회 주민 및 환경 정책 관계자

Bringing more control over your connectors

Mistral AI가 외부 엔터프라이즈 플랫폼과의 안전한 연동을 지원하기 위해 커넥터(Connectors)에 도입한 다수의 새로운 보안 및 제어 기능에 대한 소식입니다.

  • 워크스페이스별 권한 부여 및 조직 내 개별 툴의 활성화 여부를 세부 조절할 수 있는 어드민 제어 기능(GA)을 제공합니다.
  • 자동화된 AI 워크로드에서 타사 시스템 연동 시 명의 도용을 방지하기 위한 커넥터 스코프 적용 API 키 기능(GA)과 다중 계정 로그인 기능(GA)을 도입했습니다.
  • MCP 커넥터의 근본 원인 분석을 위한 커넥터 디버거(공개 프리뷰)와 워크플로우 내에서 도구를 원활히 활용할 수 있는 워크플로우 커넥터(공개 프리뷰) 등을 출시했습니다.
Notable Quotes & Details

엔터프라이즈 관리자, 보안 책임자 및 AI 에이전트를 개발하고 배포하는 개발자

Workflows for work that runs the business

미스트랄 AI가 기업용 AI 프로세스의 프로덕션 적용을 위한 영속성, 관찰 가능성, 결함 허용성을 제공하는 오케스트레이션 레이어 'Workflows'를 공개 버전으로 출시했습니다.

  • ASML, ABANCA, Moeve 등 여러 기업이 이미 Workflows를 도입하여 주요 비즈니스 프로세스 자동화에 활용 중입니다.
  • 개발자가 파이썬으로 워크플로우를 작성하면 Studio를 통해 추적 및 감사가 가능하며, Le Chat에 게시하여 조직 내 누구나 실행할 수 있도록 지원합니다.
  • 단 한 줄의 코드(wait_for_input())만으로 컴퓨팅 자원 소모 없이 인간의 승인을 기다렸다가 중단된 지점부터 실행을 재개할 수 있는 'Human-in-the-loop' 기능을 제공합니다.
Notable Quotes & Details
  • ASML
  • ABANCA
  • CMA-CGM
  • France Travail
  • La Banque Postale
  • Moeve
  • wait_for_input()

기업용 AI 파이프라인을 구축하고 프로덕션 환경에서 안정적으로 운영하려는 개발자 및 엔터프라이즈 팀

Introducing Forge

Mistral AI가 기업들이 자체 독점 데이터를 활용해 자사에 맞춤화된 AI 모델을 구축할 수 있도록 돕는 시스템인 'Forge'를 출시했습니다.

  • Forge는 기업의 내부 문서, 코드베이스, 구조화된 데이터 등을 학습하여 도메인 특화 모델을 구축할 수 있게 함
  • 사전 학습(Pre-training), 사후 학습(Post-training), 강화 학습(Reinforcement learning) 등 모델 생애주기 전반에 걸친 현대적 학습 방식을 지원함
  • 기업들이 자체 인프라 환경에서 모델을 구축하고 제어함으로써 규제 환경에서의 컴플라이언스를 준수하고 데이터 통제권을 유지할 수 있도록 지원함
Notable Quotes & Details
  • ASML
  • DSO National Laboratories Singapore
  • Ericsson
  • European Space Agency
  • Home Team Science and Technology Agency (HTX) Singapore
  • Reply

자체 데이터를 활용해 맞춤형 AI 모델과 에이전트를 구축하고자 하는 엔터프라이즈 및 규제 산업군의 기업들

Mistral AI partners with NVIDIA to accelerate open frontier models

Mistral AI가 NVIDIA의 네모트론 연합(Nemotron Coalition)에 창립 멤버로 참여하여 개방형 첨단 인공지능 모델 개발을 가속화한다.

  • Mistral AI와 NVIDIA는 Mistral AI의 특화된 모델 아키텍처 및 플랫폼과 NVIDIA의 컴퓨팅 자원 및 합성 데이터 생성 파이프라인을 결합하여 개방형 AI 모델을 공동 개발할 계획이다.
  • 연합의 첫 번째 이니셔티브로 NVIDIA DGX Cloud에서 학습되어 향후 출시될 NVIDIA Nemotron 4 제품군의 기반이 될 오픈소스 베이스 모델을 개발한다.
  • 이번 파트너십 발표와 함께 개발자, 연구원, 기업들이 활용할 수 있도록 개발 장벽을 낮춘 Mistral Small 4 모델을 출시했다.
Notable Quotes & Details
  • Mistral Small 4
  • NVIDIA Nemotron Coalition
  • “Open frontier models are how AI becomes a true platform,” said Arthur Mensch, cofounder and CEO of Mistral AI. “Together with NVIDIA, we will take a leading role in training and advancing frontier models at scale.”

인공지능 개발자, 연구원, 기업 관계자 및 AI 기술 생태계 참여자

Leanstral: Open-Source foundation for trustworthy vibe-coding

Mistral AI가 Lean 4 증명 보조기를 위해 설계한 최초의 오픈소스 코드 에이전트 Leanstral을 출시했습니다.

  • Leanstral은 Lean 4를 위해 특별히 설계된 첫 오픈소스 코드 에이전트이며 Apache 2.0 라이선스로 가중치가 공개됩니다.
  • 6B 활성 매개변수의 고도로 희소한 아키텍처를 사용하여 효율적이고 비용 효과적인 증명 엔지니어링 성능을 보입니다.
  • 자연스러운 증명 엔지니어링 성능 측정을 위해 새로운 평가 스위트인 FLTEval을 출시하고 다른 주요 에이전트 및 모델들과 벤치마크 결과를 비교했습니다.
Notable Quotes & Details
  • Leanstral-120B-A6B
  • Apache 2.0
  • Lean 4
  • FLTEval
  • GLM5-744B-A40B (FLTEval 점수 약 16.6)
  • Kimi-K2.5-1T-32B (FLTEval 점수 약 20.1)

소프트웨어 검증 및 정형 수학 연구를 진행하는 AI 에이전트 및 도구 개발자, 연구원

NVIDIA and AWS Collaborate to Bring AI to Production at Scale

엔비디아와 AWS가 대규모 AI 상용화 및 배포를 지원하기 위해 새로운 EC2 G7 인스턴스를 출시하고 Amazon OpenSearch Serverless에 GPU 가속 벡터 검색을 기본 도입하는 협력을 진행한다.

  • 엔비디아 RTX PRO 4500 Blackwell Server Edition GPU 기반의 Amazon EC2 G7 인스턴스는 이전 세대(G6) 대비 최대 4.6배 향상된 AI 추론 성능과 최대 2.1배 향상된 그래픽 성능을 제공한다.
  • Amazon OpenSearch Serverless에서 엔비디아 cuVS 라이브러리를 활용한 GPU 가속 벡터 인덱싱이 기본 적용되어 CPU 전용 빌드 대비 최대 10배 빠른 인덱싱 속도와 4분의 1 수준의 비용을 실현한다.
  • AWS는 엔비디아 GB300에 대해 '엔비디아 이그젬플러 클라우드(NVIDIA Exemplar Cloud)' 자격을 획득하여 고객에게 검증된 최적의 훈련 성능을 보장한다.
Notable Quotes & Details
  • 최대 4.6배 AI 추론 성능 향상
  • 최대 2.1배 그래픽 성능 향상
  • 최대 8개 GPU, 256GB 총 GPU 메모리, 700 Gbps EFA 네트워크, 최대 7.6TB 로컬 NVMe SSD 스토리지 지원
  • CPU 전용 빌드 대비 최대 10배 빠른 벡터 인덱싱 및 4분의 1 비용 절감
  • RTX PRO 4500 Blackwell Server Edition
  • GB300

클라우드 기반 대규모 AI 모델 배포 및 벡터 검색 가속화가 필요한 AI 개발사 및 엔터프라이즈 인프라 관리자

Samsung opens ChatGPT Enterprise and Codex access after AI restrictions

삼성전자가 과거 보안 우려로 제한했던 생성형 AI 사용 방침을 전환하여 전사적으로 챗GPT 엔터프라이즈와 코덱스 도입을 확대한다.

  • 삼성전자가 한국 내 전체 임직원 및 전 세계 DX 부문 임직원을 대상으로 챗GPT 엔터프라이즈와 코덱스를 도입한다.
  • 2023년 데이터 유출 우려로 AI 사용을 제한한 이후, 강화된 데이터 보호 및 보안 제어 기능을 갖춘 기업용 버전을 통해 재도입하는 것이다.
  • 기술 및 비기술 부서 모두에서 정보 검색, 문서 작성, 코드 작성 및 리뷰, 자동화 워크플로우 구축 등에 AI를 활용할 계획이다.
Notable Quotes & Details
  • 2026년 2월 1일 이후 한국 내 코덱스 주간 활성 사용자 수(WAU) 800% 가까이 증가
  • OpenAI Korea GM 해리슨 킴: '이번 협약은 OpenAI의 가장 큰 엔터프라이즈 배포 중 하나'
  • 2025년 10월 삼성은 OpenAI의 Stargate AI 인프라 이니셔티브 전략적 메모리 파트너로 협력 발표 (OpenAI의 메모리 수요는 월 최대 900,000장 웨이퍼 전망)

IT 및 전자 산업 종사자, 기업 보안 관리자, AI 기술 비즈니스 도입에 관심이 있는 전문가

Anthropic drops ‘workplace AI agents’ directly inside Slack

앤스로픽이 슬랙 채널 내에서 직접 공동 작업할 수 있는 비동기식 업무용 AI 에이전트 '클로드 태그' 베타 버전을 출시했다.

  • 사용자가 슬랙 스레드에서 @Claude를 태그하여 AI 에이전트를 그룹 대화에 참여시키고 협업할 수 있도록 지원한다.
  • Opus 4.8 엔진을 기반으로 하며, 기업 데이터베이스 및 코드 저장소를 연동하여 백그라운드에서 실시간 프롬프트 없이 비동기식으로 작업을 수행한다.
  • 앤스로픽 내부 개발 조직은 자체 버전의 클로드 태그를 통해 코드의 65%를 자동 생성하고 있다.
Notable Quotes & Details
  • US$65 billion Series H funding round
  • valuation to US$965 billion
  • OpenAI’s US$852 billion mark
  • Anthropic’s enterprise adoption rate reached 34.4%
  • OpenAI’s 32.3% footprint
  • Opus 4.8 engine
  • 65% of its code

슬랙을 사용하는 협업 팀, 엔지니어링 팀, IT 관리자 및 기업 관계자

Notes: 본문 뒷부분이 일부 잘려 있으나 주요 내용 파악이 가능하여 요약을 완료함

OpenAI built its own AI chip. The target is Nvidia.

OpenAI가 브로드컴과 손잡고 엔비디아 의존도를 낮추기 위한 자체 첫 추론용 AI 칩 '할라피뇨(Jalapeño)'를 공개했습니다.

  • OpenAI는 브로드컴 및 셀레스티카와 협력하여 자체 설계한 첫 추론용 AI 칩인 '할라피뇨(Jalapeño)'를 발표했습니다.
  • 할라피뇨는 훈련이 아닌 추론(인프런스) 및 사용자 질의 처리에 특화된 칩으로, 초기 테스트 결과 전력 대비 성능 및 발열 제어가 기존 최고 수준의 칩보다 우수한 것으로 나타났습니다.
  • 설계부터 테이프아웃까지 단 9개월 만에 완료되었으며, 이 과정에서 개발 기간 단축을 위해 OpenAI 자체 AI 모델이 활용되었습니다.
Notable Quotes & Details
  • GPT-5.3-Codex-Spark
  • OpenAI는 2029년까지 자사 커스텀 칩으로 약 10기가와트(원자로 10기 분량) 규모의 컴퓨팅 파워를 가동하고자 합니다.
  • 브로드컴은 2026년 말까지 마이크로소프트 및 기타 파트너사의 상용 서비스에 첫 칩이 적용될 것으로 예상하며, OpenAI는 내년에 본격적인 물량이 공급될 것으로 봅니다.
  • 할라피뇨 설계부터 제조 테이프아웃까지 걸린 시간은 9개월입니다.

AI 하드웨어 시장 동향 및 OpenAI의 비즈니스 전략에 관심이 있는 업계 관계자 및 개발자

Sentient Foundation launches $42M program to back open-source AGI builders

Sentient Foundation이 오픈소스 인공일반지능(AGI) 개발자들을 지원하기 위해 4,200만 달러 규모의 보조금 및 투자 프로그램을 출시했습니다.

  • 소수 대기업의 AI 독점을 막기 위해 오픈소스 AGI 개발자, 연구원, 스타트업을 지원하는 4,200만 달러 규모의 프로그램 발표
  • 지분 희석이 없는 보조금(Grants)과 창업자 친화적인 스타트업 투자를 결합한 자금 조달 구조 제공
  • 인터넷이나 리눅스처럼 AGI 기술도 폐쇄적인 기업 환경이 아닌 협력적인 오픈소스 생태계를 통해 발전해야 한다는 철학 반영
Notable Quotes & Details
  • 42M
  • $42 million
  • “ The future of intelligence should be built by the many, not controlled by the few, ”
  • “ A few companies are trying to become the OPEC of intelligence, meter it, price it, decide who gets it. We’re making it air. ”

오픈소스 AI 연구원, 독립 개발자, AI 스타트업 창업자 및 AI 생태계 관계자

A Princeton grad’s $30M AI detector is selling to Superhuman

생산성 소프트웨어 기업 Superhuman(구 Grammarly)이 AI 감지 스타트업인 GPTZero를 인수했다는 소식입니다.

  • 과거 Grammarly였던 Superhuman이 대표적인 AI 작문 감지 스타트업인 GPTZero를 인수하기로 합의했습니다.
  • GPTZero는 프린스턴 대학교 졸업생인 에드워드 티안(Edward Tian)이 개발한 스타트업으로, 1,900만 명 이상의 사용자 및 연간 반복 매출(ARR) 3,000만 달러를 돌파했습니다.
  • Superhuman은 이번 인수를 통해 AI 생성 콘텐츠가 넘쳐나는 인터넷 환경에서 인간이 작성한 콘텐츠를 검증하는 '신뢰성 레이어' 구축을 목표로 하고 있습니다.
Notable Quotes & Details
  • Edward Tian
  • 19 million registered users
  • $30m in annual recurring revenue
  • total funding of just $13.5m
  • false-positive rate below 1%

IT 비즈니스 및 AI 산업 트렌드에 관심이 있는 독자층

Main Capital raised the Netherlands’ biggest-ever fund on boring software

네덜란드의 사모펀드 운용사 메인 캐피탈이 AI가 기업용 소프트웨어를 대체할 것이라는 시장의 우려 속에서도 역대 최대 규모인 52억 5,000만 유로의 펀드를 조성했다.

  • 메인 캐피탈 파트너스는 두 개의 새로운 펀드(Main Capital IX 40억 유로, Main Foundation III 12억 5,000만 유로)를 통해 총 52억 5,000만 유로를 조달하며 네덜란드 사모펀드 바이아웃 사상 최대 규모의 자금 조달을 기록했다.
  • 이번 펀딩은 소프트웨어 ETF가 2025년 9월 정점 대비 약 30% 하락하고 세일즈포스 등 주요 소프트웨어 기업의 가치가 하락하는 등 시장이 침체된 시기에 이루어졌다.
  • 메인 캐피탈은 병원 예약 시스템, 지방세 기록 등 화려하지 않지만 필수적이고 전환 비용이 높은 틈새 시장의 수익성 있는 소프트웨어 기업을 인수하여 결합하는 전략을 고수하고 있다.
Notable Quotes & Details
  • €5.25bn
  • 23 years
  • September 2025
  • 30%
  • 0.5%
  • 4.7x

투자자, 사모펀드 및 기술 분야 종사자, 기업용 소프트웨어 시장 분석가

Menlo Ventures raises $3bn on the back of one Anthropic bet

벤처캐피털 멘로 벤처스(Menlo Ventures)가 인공지능 기업 앤스로픽(Anthropic)에 대한 성공적인 투자에 힘입어 역사상 최대 규모인 30억 달러의 펀드를 조성했다.

  • 멘로 벤처스는 앤스로픽에 약 10억 달러를 투자했으며 현재 그 지분 가치는 약 140억 달러에 달한다.
  • 조성된 30억 달러는 초기 단계 투자를 위한 'Menlo Ventures XVII'와 후기 성장 단계를 위한 'Menlo Inflection IV'로 나뉘어 운영된다.
  • AI 스타트업들이 비공개 상태를 오래 유지함에 따라 벤처캐피털들이 후기 투자 이익을 확보하기 위해 성장 펀드 및 특수목적회사(SPV)를 적극 활용하는 추세다.
Notable Quotes & Details
  • 3bn
  • 50-year history
  • 14bn
  • 2023
  • 1bn
  • 900bn
  • 750m
  • 18.4bn
  • 500m
  • 250m
  • bet-the-firm moment

벤처 투자자, 테크 및 AI 업계 관계자, 비즈니스 분석가

OpenAI unveils its first custom chip, built by Broadcom

OpenAI가 Broadcom과의 협력을 통해 개발한 최초의 추론용 맞춤형 칩인 Jalapeño를 공개했습니다.

  • OpenAI는 자사 추론 시스템에 맞춤 설계되었으며 자사 AI 모델의 개발 지원을 받은 최초의 맞춤형 칩 Jalapeño를 발표했습니다.
  • Jalapeño는 초기 테스트 결과 기존 최첨단 대체품 대비 전력 대비 성능(performance-per-watt)이 크게 향상된 것으로 나타났습니다.
  • 이번 맞춤형 칩 개발은 엔비디아 GPU에 대한 의존도를 줄이고 특히 실시간 코딩 모델 등의 추론 비용을 절감하여 수익성을 개선하려는 목적입니다.
Notable Quotes & Details
  • Jalapeño
  • October
  • We have a deep understanding of the workload
  • OpenAI is not only developing frontier models or building products on top of them; it is designing the infrastructure underneath them: chip architecture, kernels, memory systems, networking, scheduling, deployment systems, and product experience

AI 비즈니스 및 기술 인프라 동향에 관심이 있는 업계 분석가와 개발자

OpenAI reveals its first AI processor: Jalapeño

OpenAI가 Broadcom과의 파트너십을 통해 개발한 서버용 첫 맞춤형 AI 프로세서 칩인 'Jalapeño(할라페뇨)'를 공개했습니다.

  • OpenAI는 ChatGPT 요청 처리를 위해 Broadcom과 협력하여 개발한 첫 맞춤형 ASIC 칩인 Jalapeño를 발표했습니다.
  • 이 칩은 AI 추론(Inference) 특화용으로 설계되었으며, Nvidia GPU에 대한 의존도를 줄이기 위해 개발되었습니다.
  • OpenAI는 Jalapeño를 다세대 컴퓨팅 플랫폼의 첫 단계로 보고 있으며, 2026년 말까지 배포할 예정입니다.
Notable Quotes & Details
  • Broadcom CEO Hock Tan: 'matches the performance of Nvidia’s Blackwell chips and Google’s Tensor processing units'
  • deploy by the end of 2026
  • nine months after OpenAI revealed that it would team up with Broadcom

AI 하드웨어 산업 관계자, IT 기술 투자자 및 OpenAI 서비스 사용자

The Google Home Speaker sounds good and looks great — but it’s finicky

구글의 새로운 스마트 스피커 '구글 홈 스피커'에 대한 첫인상과 음질 및 음성 인식 성능 평가

  • 99달러의 소형 스피커임에도 풍부한 저음과 큰 출력을 제공하며, 아마존 에코 닷 맥스보다 뛰어난 음질을 보여줌
  • 소음이나 샤워기 물소리 속에서도 'Hey, Google' 호출어를 정확하게 인식하는 뛰어난 마이크 성능을 탑재함
  • 제미나이 AI 비서 기능을 지원하여 스마트 홈 제어, 정보 검색, 일정 관리 등 생활 전반의 비서 역할을 하도록 설계됨
Notable Quotes & Details
  • Google’s $99 device packs a punch
  • the speaker’s three microphones haven’t missed a single wake word
  • The Home Speaker is cleaner, louder, and just sharper in all areas. It makes the Dot Max sound like a really big phone speaker.

스마트 홈 기기 및 구글 어시스턴트(제미나이) 생태계에 관심이 있는 소비자

Using Graphify and NetworkX to Map Python Codebase Structure with God Nodes, Communities, and Architecture Visualizations

Graphify와 NetworkX를 사용하여 LLM 없이 로컬에서 Python 코드베이스 구조를 지식 그래프로 변환하고 분석 및 시각화하는 방법을 설명한다.

  • Graphify의 tree-sitter 기반 분석을 활용하여 API 키나 LLM 백엔드 없이 로컬에서 코드베이스 그래프를 추출한다.
  • 추출된 지식 그래프 데이터를 NetworkX에 로드하여 중심성 점수, 커뮤니티 탐색, 최단 경로 등을 통해 코드 구조를 분석한다.
  • 정적 및 대화형 시각화를 생성하여 모듈, 클래스, 함수, 데이터베이스 객체 간의 연결 관계를 직관적으로 이해할 수 있게 한다.
Notable Quotes & Details

코드베이스 시각화 및 정적 분석 도구에 관심이 있는 Python 개발자 및 소프트웨어 아키텍트

Nous Research Adds /learn to Hermes Agent’s Skills System, Capturing Workflows as Slash Commands Without Hand-Writing SKILL.md

누스 리서치(Nous Research)가 에이전트의 워크플로우나 문서를 분석하여 자동으로 SKILL.md 파일을 생성하고 슬래시 명령어로 등록해 주는 /learn 기능을 에르메스 에이전트(Hermes Agent)의 스킬 시스템에 추가했습니다.

  • 수동으로 SKILL.md 파일을 작성할 필요 없이 로컬 SDK, 온라인 문서 페이지, 과거 대화 내용, 메모 등을 분석하여 재사용 가능한 스킬을 자동 생성합니다.
  • 설치된 모든 스킬은 에이전트 내에서 슬래시 명령어(예: /plan)로 자동 변환되어 필요한 시점에만 온디맨드로 로드됩니다.
  • 토큰 소모를 최소화하기 위해 스킬 목록 조회, 전체 스킬 조회, 특정 참조 파일 조회 등 3단계의 점진적 노출 방식을 적용해 비용 효율성을 높였습니다.
Notable Quotes & Details
  • June 23, 2026
  • ~3k tokens

인공지능 에이전트 개발자 및 Hermes Agent를 활용하여 워크플로우를 자동화하고자 하는 개발자

16 Best Generative AI Coding Tools in 2026 Compared: Features, and Best Fit

2026년 소프트웨어 개발 방식을 변화시키고 있는 주요 생성형 AI 코딩 도구들의 특징과 쓰임새를 비교하여 소개하고 있습니다.

  • 생성형 AI 코딩 도구는 한 줄 자동완성을 넘어 전체 애플리케이션 생성 및 멀티 에이전트 파이프라인 구축 수준으로 진화했습니다.
  • Atoms, GitHub Copilot, Tabnine, Replit 등 각 도구들은 자연어 배포, 프라이버시 보호, 브라우저 기반 개발 등 고유한 강점을 제공합니다.
  • 엔지니어들은 작업의 특성에 따라 기존 워크플로우 내에서 코드를 가속화할지 또는 프롬프트만으로 전체 제품을 구축할지 선택할 수 있습니다.
Notable Quotes & Details
  • 2026
  • MARKTECHPOST10

초급 AI 엔지니어, 소프트웨어 엔지니어, 데이터 사이언티스트

Notes: 내용 불완전

DFlash Speculative Decoding Drafts Whole Token Blocks in Parallel for Up to 15x Higher Throughput on NVIDIA Blackwell

UC San Diego 연구진이 개발하고 NVIDIA Blackwell에서 최대 15배의 처리량 향상을 입증한, 전체 토큰 블록을 한 번에 제안하는 확산 기반 투기적 디코딩 기술 'DFlash'에 대한 내용이다.

  • DFlash는 기존 순차적 투기적 디코딩의 한계를 극복하기 위해 블록 확산 모델을 적용하여 여러 토큰을 단일 패스로 병렬 제안한다.
  • 대형 타겟 모델의 숨겨진 상태를 추출하여 초소형 드래프트 모델의 모든 레이어에 주입함으로써 깊이에 따른 신호 희석을 막고 수용 토큰 길이를 늘린다.
  • 검증 단계는 신뢰할 수 있는 기존 autoregressive 타겟 모델이 수행하므로 최종 출력 분포의 품질과 손실 없는 가속을 보장한다.
Notable Quotes & Details
  • 최대 15배(15x) 높은 처리량
  • EAGLE-3 대비 최대 2.5배(2.5x) 성능 향상
  • NVIDIA Blackwell
  • gpt-oss-120b
  • 6배(6x) 이상의 손실 없는 가속

AI 추론 및 가속화 기술에 관심이 있는 연구자, 개발자 및 하드웨어 엔지니어

Top 7 Coding Models You Can Run Locally in 2026

2026년 기준 개인용 GPU(소비자 하드웨어)에서 로컬로 실행하여 프라이버시를 보장하고 효과적인 개발을 돕는 우수한 로컬 코딩 AI 모델들을 소개합니다.

  • 16GB 이상의 VRAM을 갖춘 GPU가 있으면 호스팅형 코딩 어시스턴트(Claude Code, Gemini 등)에만 의존하지 않고 완전한 로컬 코딩 환경을 구축할 수 있습니다.
  • Qwen3.6 27B MTP 모델은 크기, 속도, 실제 코딩 능력 면에서 가장 균형 잡힌 로컬 코딩 모델 중 하나로, GGUF 양자화 버전을 통해 소비자용 하드웨어에서도 현실적으로 구동이 가능합니다.
  • Google의 Gemma 4 31B IT QAT는 양자화 인지 훈련(QAT)이 적용된 GGUF 버전으로 제공되어 소비자 하드웨어에 쉽게 로드되면서도 높은 품질을 유지하여 로컬 코딩 및 추론에서 뛰어난 성능을 보입니다.
Notable Quotes & Details
  • RTX 3090
  • 16GB
  • 24GB
  • 2026
  • Qwen3.6 27B MTP
  • Gemma 4 31B IT QAT

로컬 환경에서 프라이빗하고 빠른 코딩 및 에이전트 워크플로우를 구현하고자 하는 소프트웨어 개발자 및 데이터 과학자

RIFT-Bench: Dynamic Red-teaming For Agentic AI Systems

다양한 에이전트 AI 시스템의 보안 평가를 위한 그래프 표현 기반의 동적 레드티밍 방법론인 RIFT-Bench를 소개합니다.

  • 기존의 보안 평가는 특정 구현이나 도메인에 종속되어 있어 이기종 시스템 간의 통합 비교가 제한적이었습니다.
  • RIFT-Bench는 시스템 구조를 추출하는 탐색(Discovery) 단계와 적응형 적대적 공격을 배포하고 평가 보고서를 생성하는 스캐닝(Scanning) 단계로 구성됩니다.
  • 다양한 구현의 45개 에이전트 시스템에 대한 평가 파이프라인의 효과를 입증하고 완화 전략의 직접적인 평가도 지원합니다.
Notable Quotes & Details
  • arXiv:2606.23927
  • 45 agentic systems

AI 보안 연구원, 에이전트 AI 시스템 개발자, LLM 보안 평가 전문가

Neuro-Symbolic Drive: Rule-Grounded Faithful Reasoning for Driving VLAs

기존 자율주행 VLA 모델의 불완전한 추론을 보완하기 위해 고전적 규칙 기반 플래너의 기호적 의사결정 과정을 지도 학습 경로로 활용하는 신경-기호 자율주행 프레임워크인 'Neuro-Symbolic Drive'를 소개한다.

  • 자율주행 VLA(Vision-Language-Action) 모델의 사고 체인(CoT) 추론이 실제 계획된 차량 움직임과 인과적으로 단절되는 문제를 해결하기 위해, 규칙 기반 플래너에서 추출된 규칙 기반 추론 궤적을 자율주행 VLA에 학습시킨다.
  • 규칙 기반 플래너를 symbolic AI 시스템으로 취급하여 실행 가능한 의사결정 추적 과정을 직렬화하고, 이를 Qwen3.5-4B 모델의 파인튜닝에 사용해 행동과 추론의 결합을 보장한다.
  • 시뮬레이터 벤치마크 테스트 결과, 3개 카메라 환경에서 ADE@3s를 0.47에서 0.26으로, 미스율을 8.30%에서 6.40%로 줄였으며, 8개 카메라 환경에서도 성능 향상을 입증했다.
Notable Quotes & Details
  • Qwen3.5-4B
  • ADE@3s from 0.47 to 0.26
  • miss rate from 8.30% to 6.40% under three-camera perception
  • ADE@3s from 0.54 to 0.26 and miss rate from 10.13% to 5.99% under eight-camera perception

자율주행 기술 연구원, VLA 모델 개발자, 로보틱스 및 AI 연구자

Critique of Agent Model

진정한 에이전트와 단순 자동화 시스템의 경계를 명확히 하고, 이를 바탕으로 진정한 자율성을 갖춘 새로운 GIC(Goal-Identity-Configurator) 에이전트 아키텍처를 제안하는 논문입니다.

  • Descartes의 철학적 개념과 공상과학의 자율적 존재 묘사를 바탕으로 AI 에이전트의 현황을 분석하고 목표, 정체성, 의사결정, 자기조절, 학습의 5개 차원으로 에이전트 아키텍처를 진단함
  • 외부 인프라(scaffolding)로 구축된 자동화 시스템(agentic)과 시스템 내부에서 능력과 자율성이 내생적으로 발생하는 진정한 에이전트 시스템(agentive)을 구분함
  • 계층적 목표 분해, 정체성 진화, 시뮬레이션 기반 추론, 기계 학습된 자기조절 등을 결합한 범용 에이전트 모델 아키텍처인 GIC(Goal-Identity-Configurator)를 제안함
Notable Quotes & Details
  • arXiv:2606.23991v1
  • GIC (Goal-Identity-Configurator)

AI 아키텍처 연구원, 자율 시스템 개발자, AI 안전 및 거버넌스 전문가

Can Language Model Agents be Helpful Circuit Explainers in Mechanistic Interpretability?

기계론적 해석 가능성(Mechanistic Interpretability) 분야에서 언어 모델(LM) 에이전트가 회로 설명 업무를 도울 수 있는지 분석하고 평가 벤치마크와 프레임워크를 제안하는 연구입니다.

  • 회로의 각 구성 요소를 '관찰-가설 생성-인과 검증'의 반복 루프를 통해 분석하고 회로 수준의 작업 설명과 구성 요소별 설명을 생성하는 에이전트형 설명 모델 HyVE를 제안함
  • 84개의 반합성 트랜스포머 회로와 163개의 구성 요소 수준 주석을 활용한 회로 설명 벤치마크인 AgenticInterpBench를 구축하여 성능을 평가함
  • 실험 결과 LM 에이전트가 유용한 설명을 찾아내지만 인과 검증 단계에서의 불완전한 계획, 코드 실행 오류 등으로 인해 신뢰할 수 있는 검증을 수행하는 데 한계가 있음을 밝힘
Notable Quotes & Details
  • arXiv:2606.24026v1
  • AgenticInterpBench
  • HyVE
  • 84 semi-synthetic transformer circuits
  • 163 component-level annotations
  • Llama-3-8B

인공지능 모델 해석 및 기계론적 해석 가능성(Mechanistic Interpretability) 분야의 AI 연구원 및 개발자

Ensemble Feature Selection and Harris Hawks Optimization for Explainable Mental Health Risk Prediction in Female Sex Workers

여성 성노동자(FSWs)의 정신 건강 위험(우울증)을 예측하기 위해 앙상블 특성 선택과 해리스 매 최적화(HHO)를 결합한 설명 가능한 AI(XAI) 모델을 제안하는 연구입니다.

  • ANOVA와 상호 정보량을 활용한 앙상블 특성 선택 및 해리스 매 최적화 알고리즘으로 튜닝된 로지스틱 회귀 모델을 결합한 하이브리드 예측 모델 제안
  • 3,005명의 여성 성노동자 데이터를 적용하여 기존 분류기보다 우수한 예측 성능을 확인하고 외상 후 스트레스, 고객 폭력, 직업적 요인을 주요 우울증 기여 요인으로 식별
  • 설명 가능한 AI(XAI) 기법을 활용하여 예측 모델이 식별한 정신 건강 위험 요인의 이해도를 높이고 조기 개입 및 맞춤형 심리사회적 치료 지원 방안 제시
Notable Quotes & Details
  • 3,005명
  • 정확도 95.78%
  • F1 스코어 95.77%
  • AUC 0.96

정신 건강 연구자, AI 및 기계 학습 모델 개발자, 사회 복지 및 공공 보건 정책 입안자

Systematic Exploration of 4-Expert Heterogeneous Mixture-of-Experts via Automated Pipeline Search

LEMUR 신경망 데이터셋 생태계 내에서 이종 4-Expert Mixture-of-Experts(MoE4) 아키텍처를 자동으로 탐색하기 위한 대규모 파이프라인의 구축과 그 분석 결과를 다루고 있습니다.

  • 수작업 설계를 대체하는 결정론적 코드 조립 생성기를 통해 LEMUR 데이터베이스의 기본 아키텍처 제품군을 결합하는 MoE4 앙상블 탐색 파이프라인을 구축했습니다.
  • 28일간의 탐색을 통해 4,463개의 후보 모델을 생성하고 1,021개의 평가를 완료했으나, itertools.combinations의 알파벳순 열거로 인해 전체 탐색 공간이 AirNet 제품군에 편향되는 문제가 발생하여 이를 분석하고 무작위 샘플링 해결책을 제안했습니다.
  • AirNet이 포함된 범위 내에서는 ShuffleNet과 MobileNetV3의 조합이 가장 높은 정확도를 보인 반면, FractalNet과 MNASNet은 성과가 낮아 향후 제외할 것을 권장했습니다.
Notable Quotes & Details
  • 28-day campaign
  • NVIDIA RTX 4090
  • 4,463 candidate models
  • 1,021 were evaluated successfully
  • 4.8% of the theoretical 23,751 possible 4-family combinations
  • mean accuracy up to 0.632

인공지능 아키텍처 설계 및 Mixture-of-Experts(MoE) 효율화 연구원

Weight-Space Geometry of Offline Reasoning Training

Qwen3-4B 모델을 기반으로 다양한 오프라인 강화학습 손실 함수들을 적용해 추론 증류 학습을 진행한 후, 각 방법론의 가중치 변화 벡터의 기하학적 유사성과 메커니즘 차이를 분석한 연구입니다.

  • SFT, RFT, RIFT는 매우 유사한 가중치 변화 방향(코사인 유사도 0.97 이상)을 보이며 GSM8K 성능도 비슷했습니다.
  • Offline GRPO는 SFT 방향과 직교하는 성분을 크게 포함하지만 SFT의 손실 분지 내에 머무르는 반면, DPO는 거의 직교하는 하위 공간에 위치하며 전혀 다른 가중치 업데이트 양상을 보였습니다.
  • DPO는 GSM8K(93.5%) 및 AIME26(30.0%)에서 다른 모든 방법론 대비 압도적으로 높은 성능을 기록했습니다.
Notable Quotes & Details
  • SFT, RFT, RIFT의 가중치 변화 코사인 유사도 >= 0.97
  • SFT, RFT, RIFT의 GSM8K 정확도 87-88% (n=1319)
  • Offline GRPO의 SFT 대비 직교 성분 전역적 ~67%, 후반 레이어 최대 ~86%
  • DPO의 CKA 유사도 하락 ~0.46
  • DPO의 GSM8K 정확도 93.5% (McNemar p < 10^-9)
  • DPO의 AIME26 정확도 30.0% (타 방법론 3.3-10.0%)
  • DPO 학습 시 다른 방법론보다 10배 작은 학습률(learning rate) 사용

인공지능 모델 학습 및 정렬(Alignment) 연구자, 강화학습(RLHF/DPO) 및 모델 증류 분야 엔지니어

A Survey on Federated Causal Discovery and Inference

프라이버시 규정과 통신 제약 속에서 기관 간 분산된 데이터를 활용해 인과 관계 규명 및 효과 추론을 분산 처리하는 연합 인과 발견(FCD) 및 연합 인과 추론(FCI) 분야를 체계적으로 분석한 최초의 서베이 논문이다.

  • 연합 인과 발견(FCD)을 방법론적 패러다임, 연합 토폴로지, 구조적 범위라는 세 가지 축의 다차원 분류법으로 정리하였다.
  • 연합 인과 추론(FCI)을 대상 추정량과 고전적 가중치법에서 딥 생성 아키텍처에 이르는 추정 전략별로 분류하였다.
  • 분리되어 다뤄지던 FCD와 FCI를 연합 인과 추론 파이프라인의 상호 보완적인 단계로 정형화하여 연결하였다.
Notable Quotes & Details
  • arXiv:2606.23741

연합 학습 기반의 인과적 추론 및 기계 학습 연구자

Low-power analogue neural networks with trainable nonlinear connections for continuous control

물리적 연결에 학습 가능한 비선형 함수를 배치하여 저전력 아날로그 신경망의 효율성을 높이는 새로운 아키텍처에 관한 연구입니다.

  • 콜모고로프-아놀드 네트워크(KAN)에서 영감을 받아 물리적 연결 자체에 학습 가능한 비선형 연결을 배치함
  • 로봇 운동학, 연속 제어 등 부드럽고 연속적인 제어 작업에서 다층 퍼셉트론(MLP)보다 훨씬 적은 노드와 연결로도 효율적인 표현이 가능함
  • CMOS 구현 시 약 30 마이크로와트(microwatts)의 초저전력으로 동작 가능한 것으로 예상됨
Notable Quotes & Details
  • 35,000
  • 30 microwatts

아날로그 컴퓨팅, 저전력 인공지능 하드웨어, 로보틱스 제어 분야 연구자 및 개발자

Exploring Dualistic Meta-Learning to Enhance Domain Generalization in Open Set Scenarios

미지 영역의 클래스 불일치 문제를 해결하기 위해 이중 메타학습 전략(MEDIC)을 제안하여 오픈셋 도메인 일반화 성능을 향상시키는 연구입니다.

  • 기존 도메인 일반화는 소스와 타깃 도메인 간의 라벨 불일치 실무 사례를 간과하는 경향이 있음
  • 오픈셋 도메인 일반화에서 일대다 분류기 방식은 데이터 불균형으로 인해 결정 경계가 왜곡되어 알려진 클래스마저 거부하는 문제가 발생함
  • 도메인 간 및 클래스 간 태스크 분할을 향해 암시적 그레이디언트 매칭을 동시에 고려하는 MEDIC 전략을 통해 경계를 최적화함
Notable Quotes & Details
  • arXiv:2606.23758

도메인 일반화 및 오픈셋 인식 분야를 연구하는 AI 연구원 및 엔지니어

EXPO-SQL: Execution-based Clause-level Policy Optimization for Text-to-SQL

Text-to-SQL 성능 향상을 위해 실행 피드백을 기반으로 SQL 쿼리의 절(clause) 단위로 세밀한 보상을 부여하는 정책 최적화 프레임워크 EXPO-SQL을 제안하는 논문입니다.

  • 기존 Text-to-SQL 강화학습 방법들은 쿼리 전체에 일률적인 보상을 제공하여 개별 SQL 절의 오류를 구분하지 못하는 한계가 있었습니다.
  • EXPO-SQL은 에러 메시지와 절 단위의 점진적 실행 분석을 통해 오류가 있는 절을 식별하고 절 단위의 미세 보상을 제공합니다.
  • 널리 사용되는 Text-to-SQL 벤치마크 테스트에서 기존 지도 미세조정(SFT), 프롬프팅 및 강화학습 기반 기법들보다 우수한 성능을 입증했습니다.
Notable Quotes & Details
  • arXiv:2606.23693v1
  • https://github.com/jhn25/EXPO-SQL

AI 연구원, 자연어 처리 및 데이터베이스 질의 생성(Text-to-SQL) 기술에 관심이 있는 개발자

ModTGCN: Modularity-aware Graph Neural Networks for Text Classification

텍스트 분류를 위해 클래스 일관성 있는 문서 커뮤니티 구조를 보존하고 최적화하는 모듈성 인식 그래프 신경망(ModTGCN)을 제안하는 연구입니다.

  • 기존 그래프 기반 텍스트 분류 모델이 로컬 이웃 집계에만 의존하여 전역 커뮤니티 구조를 간과하는 문제를 해결하기 위해 ModTGCN을 제안했습니다.
  • 크로스 엔트로피와 모듈성 기반 보조 목적 함수를 공동 최적화하여 판별적 표현을 보존하면서 클래스 일관성을 가진 문서 커뮤니티를 촉진합니다.
  • 기존의 이종 TextGCN 그래프를 별도의 문서-단어 및 단어-단어 구성 요소로 분리하여 훈련 속도를 2배에서 10배까지 향상시켰습니다.
Notable Quotes & Details
  • 2x-10x

인공지능 및 자연어 처리(NLP) 연구자, 그래프 신경망(GNN) 분야의 개발자

Quantifying Prior Dominance in RAG Systems

검색 증강 생성(RAG) 시스템에서 LLM의 기존 매개변수 기억과 실제 문맥 정보 추출을 엄격하게 구분하고 정량화하기 위해 새로운 NCU(Normalized Context Utilization) 메트릭을 제안하고 분석한 연구입니다.

  • 기존 RAG 평가는 매개변수적 기억 리콜과 진정한 문맥 정보 추출을 구분하지 못하는 한계가 있어, 이를 해결하기 위해 토큰 로그 확률 기반의 NCU 메트릭을 도입했습니다.
  • 엄격한 사실 추출 작업(생각의 흐름 추론이 없는 경우)에서 기존 스케일링 법칙은 한계를 보이며, 소형 언어 모델(SLM)이 대형 모델과 비슷하거나 더 우수한 성능을 나타냈습니다.
  • 상용 API 모델은 적대적 문맥 충돌 상황에서 외부 증거를 무시하거나 매개변수적 사전 지식과 모순될 때 신뢰도가 급격히 붕괴하는 현상(부정적 전이)이 자주 발생했습니다.
Notable Quotes & Details
  • arXiv:2606.23695v1
  • 1.5B to 72B parameters
  • 평가 대상 상용 API가 적대적 충돌의 거의 절반에 가까운 상황에서 명시적인 외부 증거를 무시함

AI 및 자연어 처리(NLP) 연구자, RAG 시스템 설계 및 평가 엔지니어

Self-Recognition Finetuning can Prevent and Reverse Emergent Misalignment

거대 언어 모델(LLM)의 창발적 정렬 불량(Emergent Misalignment)이 일관된 오정렬 페르소나의 습득보다는 정렬된 기존 캐릭터의 불안정화에서 비롯된다는 점에 착안하여, 자기 생성 텍스트 인식(SGTR) 미세조정을 통한 캐릭터 예방 및 정렬 복구 방어 효과를 연구한 논문입니다.

  • 창발적 정렬 불량(EM)은 모델이 유해한 콘텐츠를 직접 학습하기보다 정렬된 기존 캐릭터가 파괴되면서 오정렬된 페르소나가 활성화되는 방식으로 작동합니다.
  • 자기 생성 텍스트 인식(SGTR) 미세조정은 일반 도메인 데이터나 단어 계산 등 다른 미세조정 대비 개별 성능 지표 저하 없이 일관되게 정렬 불량을 예방하고 예방 효과를 높입니다.
  • 모델의 정체성을 담은 시스템 프롬프트를 제거하는 것만으로도 창발적 정렬 불량 미세조정의 부정적 효과를 실질적으로 감소시킬 수 있음을 입증했습니다.
Notable Quotes & Details
  • arXiv:2606.23700v1
  • GPT-4.1
  • Qwen2.5-32B-Instruct
  • Seed-OSS-36B-Instruct

AI 정렬 및 안전성 연구자, LLM 미세조정 및 보안 전문가

Evaluating LLM Usage for Efficient and Explainable Numerical and Classified Implicit Sentiment Analysis of Product Desirability

대규모 언어 모델(LLM)을 사용하여 제품 선호도 피드백에서 암묵적 감성을 효율적이고 설명 가능하게 분석하는 프레임워크를 제안하고 평가한 연구입니다.

  • ZORQ 및 CARMA의 두 가지 제품 선호도 툴킷(PDT) 데이터셋을 사용하여 LLM의 제로샷 연속 수치 감성 점수화 및 범주형 감성 분류 성능을 평가함
  • LLM은 전문가 라벨과 유사한 결과를 생성하여 최대 0.97의 피어슨 상관관계와 최대 94%의 분류 정확도를 달성함
  • GPT-4o-mini 모델은 더 큰 모델과 유사한 성능을 보이면서도 비용을 94% 절감하여 확장 가능한 배포를 지원함
Notable Quotes & Details
  • 피어슨 상관관계 최대 0.97
  • 분류 정확도 최대 94%
  • GPT-4o-mini는 더 큰 모델 대비 94% 낮은 비용으로 유사한 성능 달성
  • arXiv:2606.23701v1

자연어 처리 및 감성 분석 연구자, LLM을 활용한 제품 피드백 분석 및 시장 조사 연구원

단어 아래 빨간색·초록색 물결선을 남긴 Tony Krueger를 추모하며

Microsoft Word에서 단어 아래에 빨간색과 초록색 물결선으로 맞춤법 및 문법 오류를 표시하는 직관적인 피드백 UI를 개발한 엔지니어 Tony Krueger를 추모하는 글입니다.

  • Tony Krueger는 Microsoft Word의 초기 버전들 개발에 참여하며 맞춤법 및 문법 오류를 빨간색과 초록색 물결선으로 즉시 표시하는 비차단식 피드백 기능을 개발함
  • 이전의 Auto Spell Check는 사용자의 작업을 중단시키는 차단형 방식이라 꺼두는 경우가 많았으나, 그는 백그라운드에서 작동하며 시각적인 물결선으로 표시하는 비침해적인 방식을 고안함
  • 그는 또한 Windows Entertainment Pack용 Chip’s Challenge 게임을 MS-DOS 소스 코드 없이 역공학하여 Windows로 이식하는 등의 다양한 기술적 업적을 남김
Notable Quotes & Details
  • Word 1.0
  • Word 1.1
  • Word 2.0
  • Word for OS/2
  • Word for Mac
  • Word 6.0
  • The red and green squiggles!? I love the red and green squiggles!

소프트웨어 엔지니어, IT 기술 역사 및 사용자 인터페이스(UI/UX) 디자인에 관심이 있는 독자층

LLM Wiki와 본유적 부하

LLM Wiki 사용 시 본유적 부하(Germane Load)를 줄이고 개인 지식 관리(PKM)의 본질적인 가치를 지키기 위해 AI를 단순 도구로 제한적으로 사용하는 경험과 고찰

  • AI를 활용한 기계적인 오탈자 수정은 개인의 어휘력 향상에 도움이 되지 않으며 지식 검증에 대한 추가적인 스트레스를 유발함
  • 문서를 연결하고 헤딩 누락을 찾거나 구조를 변경하는 등 수동으로 문서의 연결 고리를 만드는 과정 자체가 학습과 지식 관리에 있어 유의미함
  • 지식 관리 도구(Marksman 등)가 미흡한 부분을 보완하는 스크립트 작성 등 AI를 보조적 도구로만 제한적으로 활용하는 것이 바람직함
Notable Quotes & Details
  • marksman이 못하는, 중간 레벨 헤딩 누락을 찾는 스크립트를 작성하는 정도로만요
  • 문서 연결하는 과정 자체가 의미있다는 내용이 좋네요

개인 지식 관리(PKM) 및 LLM Wiki를 활용 중이거나 효율적인 지식 정리 방식을 고민하는 IT 개발자 및 일반 사용자

취약점 보고서는 더 이상 특별하지 않다

LLM의 등장으로 보안 취약점 보고서의 가치가 떨어지면서 오픈소스 유지보수에서 취약점 선별과 대응 방식의 변화가 필요하다는 주장이다.

  • LLM을 유지보수자와 공격자 모두 사용할 수 있게 되면서, 핵심 병목이 잠재 이슈 발견에서 실제 취약점 선별로 이동하였다.
  • 외부 연구자의 취약점 보고가 유발하는 노이즈가 커져 curl처럼 보고 채널을 일시 중단하는 등의 사례가 나타나고 있다.
  • 유지보수자의 자원은 보고 대응 자체보다 분류, 빠른 수정, 예방 및 CI에서의 LLM 분석 실행 등에 더 투입되어야 한다.
Notable Quotes & Details
  • 2026년
  • 최전선 모델을 써도 오탐률이 90%에 가까울 때가 있음

오픈소스 프로젝트 유지보수자 및 보안 연구자

Mistral OCR 4 공개

Mistral AI가 텍스트 추출을 넘어 바운딩 박스, 블록 분류, 인라인 신뢰도 점수를 제공하고 170개 언어 및 자체 호스팅을 지원하는 문서 이해 모델 Mistral OCR 4를 공개했습니다.

  • 단순 텍스트 추출을 넘어 바운딩 박스, 블록 유형, 인라인 신뢰도 점수 등 구조화된 표현을 함께 제공합니다.
  • 10개 언어 그룹의 170개 언어를 지원하며, 단일 컨테이너 배포를 통한 완전한 자체 호스팅이 가능해 데이터 주권을 보장합니다.
  • 사람 선호도 평가에서 평균 72%의 승률을 기록하고 OlmOCRBench에서 85.20점을 기록하는 등 높은 성능을 보였습니다.
Notable Quotes & Details
  • 170개 언어
  • 평균 72% 승률
  • OlmOCRBench 85.20
  • OmniDocBench 93.07
  • OCR 4 API: 1,000페이지당 $4
  • Batch API: 1,000페이지당 $2
  • Document AI: 1,000페이지당 $5

문서 데이터 수집 파이프라인을 구축하는 개발자, RAG 및 에이전트 시스템 설계자, 데이터 주권과 컴플라이언스가 중요한 엔터프라이즈 조직

F3 - 미래를 위한 오픈소스 데이터 파일 형식

효율성과 상호운용성, 확장성을 위해 내장 Wasm 디코더와 데이터 조직 방식을 제공하는 새로운 오픈소스 데이터 파일 형식 F3 및 관련 분석용 파일 형식들에 대한 논의

  • F3는 데이터와 메타데이터뿐만 아니라 데이터를 디코딩하는 WebAssembly 바이너리를 내장하여 플랫폼 간 호환성을 보장하고자 하는 파일 형식입니다.
  • 현재 F3는 논문의 아이디어를 검증하는 연구 프로토타입 단계이며, 빌드는 Intel 머신의 Debian 12에서만 테스트되었고 FlatBuffer 기반으로 정의되어 있습니다.
  • 업계 표준인 Parquet의 한계를 극복하려는 시도이나, F3는 빠른 분석보다 임의 접근 개선에 치우쳐 있고 디코딩을 위한 Wasm과 FlatBuffers 요구로 인해 목적이 다소 모호하다는 지적을 받습니다.
Notable Quotes & Details
  • https://dl.acm.org/doi/epdf/10.1145/3749163
  • cargo build -p fff-poc
  • cargo test -p fff-poc
  • https://www.vldb.org/pvldb/vol17/p148-zeng.pdf
  • https://www.langchain.com/blog/introducing-smithdb

데이터 엔지니어, 오픈소스 파일 형식 설계자, 분석용 쿼리 엔진 개발자 및 IT 커뮤니티 개발자

I compiled LLM inference pricing across 7 providers — the caching numbers are surprising(spreadsheet included) [R]

7개 주요 LLM 제공업체의 추론 비용을 정리한 스프레드시트를 통해 프롬프트 캐싱 비용 및 정책의 중요성과 제공업체 간의 가격 편차를 분석하고 공유하는 내용이다.

  • OpenRouter, DeepSeek, Together AI, Fireworks, Groq 등 7개 제공업체의 입력/출력 토큰 가격, 컨텍스트 창, 캐싱 가격 등을 비교 분석함
  • 동일한 모델이라도 제공업체에 따라 캐싱 적용 시 비용 차이가 수십 배까지 발생하여 캐싱 정책이 전체 비용에 결정적인 영향을 미침
  • 실제 처리량(tokens/sec), 대기 시간, 양자화 여부, 네트워크 비용 등은 아직 비교 항목에 포함하지 못함
Notable Quotes & Details
  • 7 providers
  • DeepSeek V4 Pro

LLM 제공업체의 가격과 효율적인 캐싱 정책을 비교하려는 개발자 및 RAG/에이전트 파이프라인 구축자

Could it be that there aren’t really any medical LLM APIs available right now? [D]

사용자가 의학 연구용 텍스트 생성을 위해 의학 특화 LLM API를 찾았으나 공개된 API를 찾지 못해 실제로 사용 가능한 의학 LLM API가 없는지 질문하는 내용이다.

  • Hugging Face에서 MedGemma, BioMistral 같은 의학 LLM 모델은 찾았으나 공개 API가 제공되지 않는 것처럼 보임
  • 사용자는 모델을 직접 호스팅하여 실행하는 방식은 원하지 않음
  • 현재 시점에서 실제로 사용 가능한 의학 LLM API가 존재하는지에 대한 의문 제기
Notable Quotes & Details
  • MedGemma
  • BioMistral

의학 관련 AI 연구원 및 LLM API를 활용해 의료 텍스트를 생성하려는 개발자

Unlimited-OCR: One-shot Long-horizon OCR

Baidu에서 Deepseek-OCR을 한 단계 발전시켜 NVIDIA GPU 환경에서 원샷 긴 호흡(long-horizon) OCR을 수행하는 Unlimited-OCR을 공개했다.

  • Deepseek-OCR을 기반으로 한 Unlimited-OCR 모델 및 논문을 arXiv에 공개함
  • 파이썬 3.12.3 및 CUDA 12.9 환경에서 Huggingface transformers와 SGLang을 사용한 실시간 및 배치 추론을 지원함
  • Hugging Face Spaces 및 ModelScope에서 데모와 모델을 이용할 수 있음
Notable Quotes & Details
  • [2026/06/24]
  • [2026/06/23]
  • [2026/06/22]
  • python 3.12.3 + CUDA12.9
  • kernels==0.9.0

OCR 모델을 활용해 긴 문서나 이미지를 처리하려는 개발자 및 연구자

The E Ink tablet that successfully replaced my iPad and Kindle is 40% off on Amazon now

아마존 프라임 데이를 맞아 39% 할인 판매 중인 시력 보호 디스플레이 탑재 태블릿 TCL Nxtpaper 11 Plus의 특징과 할인 정보입니다.

  • 일반 컬러 태블릿 화면에서 단축키 하나로 E-Ink 스타일의 종이 느낌 화면(흑백/컬러)으로 전환할 수 있는 Nxtpaper 디스플레이 기술이 특징입니다.
  • 11.5인치 디스플레이(2.2K 해상도, 120Hz 주사율), 8,000 mAh 배터리, 16GB RAM, 256GB 저장공간 및 쿼드 스피커를 갖추고 있습니다.
  • 원래 가격 370달러에서 39% 할인된 224달러(146달러 할인)에 스타일러스 펜과 플립 케이스가 포함된 패키지로 판매 중입니다.
Notable Quotes & Details
  • $224
  • 39% Amazon Prime Day deal
  • $370
  • $146 discount
  • 11.5-inch display
  • 2.2K resolution
  • 120Hz refresh rate
  • 8,000 mAh battery
  • 16GB of RAM
  • 256GB of storage

태블릿과 전자책 리더기를 동시에 필요로 하거나 시력 보호 기능 및 가성비를 중요하게 생각하는 소비자

I've spent 48 hours with the Google Home Speaker, and Gemini is off to a promising start

6년 만에 출시된 구글 홈 스피커의 48시간 사용기를 통해 제미나이(Gemini) 탑재 스마트 스피커로서의 첫인상과 특징을 소개합니다.

  • 구글이 6년 만에 선보인 스마트 스피커로, 기존 네스트(Nest) 브랜드를 버리고 '구글 홈 스피커'로 회귀했습니다.
  • 제미나이(Gemini)가 탑재된 100달러 가격의 스마트 스피커로 360도 오디오 경험을 제공합니다.
  • 이전 네스트 미니 대비 2.5배 더 강력한 베이스를 탑재했다고 하지만, 58mm 단일 드라이버 사용으로 성능 업그레이드에 우려하는 목소리도 있습니다.
Notable Quotes & Details
  • 48 hours
  • $100
  • 2.5 times the bass of the Nest Mini
  • 58mm driver

스마트 홈 기기 및 구글 AI 어시스턴트에 관심이 있는 일반 소비자

Your Linux PC has a Secure Boot problem - what to do first (and the workaround to avoid)

Secure Boot 인증서 만료로 인해 Linux PC 사용자에게 발생할 수 있는 부팅 문제와 이에 대한 설명 및 대처 방안을 다루고 있습니다.

  • Secure Boot 인증서의 만료 기간이 다가옴에 따라 Linux 시스템 부팅에 문제가 생길 가능성이 제기되고 있습니다.
  • 이는 마이크로소프트가 Linux를 의도적으로 차단하는 것이 아니라 Secure Boot 인증서 자체의 만료일이 존재하기 때문입니다.
  • 대부분의 주요 Linux 배포판은 마이크로소프트의 서명을 받은 1단계 부트로더인 shim 방식을 사용하여 이 문제를 우회해 왔습니다.
Notable Quotes & Details
  • 2026
  • Secure Boot certificates have always had expiration dates.

Linux 사용자 및 PC 보안 관련 기술자

Make an Origami Circuit Board

홍콩시티대학교 연구진이 종이를 접고 자르는 압력만으로 액체 금속이 주입된 종이에 전도성 회로를 만드는 오리가미 회로 기판 기술을 개발했다.

  • 액체 금속이 주입된 부직포에 접거나 자르는 압력(2.5~100 MPa)을 가하면 절연 산화막이 깨지면서 전도성 경로가 형성된다.
  • 기존의 구리 테이프 부착 방식과 달리, 종이 접기와 전도선 제작 과정을 하나로 통합하여 단선 위험을 줄이고 제작을 단순화한다.
  • 에어브러시 스프레이 방식과 스텐실을 도입하여 종이의 특정 영역에만 액체 금속을 주입하고 원치 않는 도전을 방지할 수 있도록 공정을 개선했다.
Notable Quotes & Details
  • 2.5 to 100 megapascals
  • 55 percent polyester and 45 percent cellulose

전자기기 DIY 메이커, 종이 공예가, 디지털 크래프트 및 재료 공학 연구자

Notes: 본문 뒷부분이 일부 생략되어 있으나 주요 기술적 내용과 실험 결과는 포함되어 있음

AI Is Designing Radio Chips That Humans Couldn’t Even Imagine

인공지능(AI)을 활용하여 전통적으로 복잡한 '어둠의 예술'로 여겨지던 무선 주파수 집적회로(RFIC) 설계를 혁신하고 시간을 단축하는 기술에 관한 이야기입니다.

  • 프린스턴 대학교 연구진은 강화학습과 역설계를 활용하여 처음부터 빠르게 RFIC를 설계하는 데 성공했습니다.
  • 디자인 확산 모델을 통해 인간이 이해하기 어렵지만 성능이 우수하고 독창적인 RF 레이아웃을 신속하게 생성할 수 있습니다.
  • AI 기반 설계는 작업 설계 시간을 대폭 단축하여 6G, 자율주행, 위성 통신 등의 발전을 가속화할 수 있습니다.
Notable Quotes & Details
  • AlphaGo
  • Lee Sedol
  • 6G

반도체 설계 엔지니어, AI 연구자 및 기술 트렌드에 관심이 있는 독자층

Home Broadband Is 5G’s Surprise Killer App

5G 이동통신 인프라를 활용하여 유선 케이블이나 광랜 없이 가정 및 소규모 기업에 고속 인터넷을 제공하는 고정형 무선 접속(FWA) 서비스가 5G의 가장 성공적인 킬러 애플리케이션으로 부상하고 있다.

  • FWA는 기존 5G 이동통신망 인프라와 남는 용량을 재사용하여 광케이블 포설보다 훨씬 저렴한 비용으로 초고속 가정용 인터넷을 제공한다.
  • FWA 수신기(CPE)는 모바일 기기보다 큰 안테나와 안정적인 전원 공급 덕분에 밀리미터파 등 5G 기술을 효율적으로 활용할 수 있다.
  • 모바일 트래픽이 감소하는 시간대에 가정용 인터넷 트래픽이 급증하는 이용 패턴 차이를 활용하여 통신사들이 5G 주파수 효율을 극대화하고 있다.
Notable Quotes & Details
  • FWA는 현재 1,400만 명 이상의 미국 가입자에게 서비스를 제공하고 있으며, 전 세계 무선 트래픽의 28%를 차지한다.
  • 인도 최대 통신사인 Jio는 지난해 기준 900만 명 이상의 가입자를 보유한 세계 최대 FWA 제공업체 중 하나이다.
  • 모바일 트래픽은 오후 8시 이후 감소하기 시작하며, 바로 이 시점이 가정용 인터넷 사용이 최고조에 달하는 시간이다.

IT 산업 종사자, 통신 업계 분석가, 초고속 인터넷 서비스 가입자 및 인프라 기획자

Presentation: Rules for Understanding Language Models

언어 모델의 행동을 규정하는 5가지 규칙과 모델이 개인이 아닌 집단처럼 작동하는 이유, 그리고 평가 데이터 암기의 한계를 설명하는 발표 내용이다.

  • 언어 모델은 개념을 학습하는 것보다 50년 치의 미적분 시험을 암기하는 것이 더 쉽기 때문에 가능한 모든 것을 암기하려 한다.
  • 모델이 문제를 맞혔다고 해서 그것이 해당 문제를 해결하는 데 필요한 개념을 실제로 이해하고 있음을 의미하지는 않는다.
  • 토큰화로 인한 의미론적 맹점과 모델이 사용자의 편향 및 인구통계학적 특성에 맞추기 위해 미묘한 데이터 연관성을 활용하는 아첨(sycophancy) 메커니즘을 설명한다.
Notable Quotes & Details
  • Naomi Saphra
  • Whenever a model gets something right, that doesn't mean that it knows the concepts that are required to get it right.

인공지능 연구원, 소프트웨어 엔지니어, 데이터 과학자

Dawn of the Apex Agentic Adversary

2026년 초 고도화된 AI 에이전트 모델의 등장으로 사이버 위협의 발생 속도가 인간의 대응 능력을 초월하는 기계적 속도로 압축되고 있습니다.

  • AI 에이전트 모델이 코드 제안을 넘어 취약점을 직접 테스트하고 무기화 및 공격을 즉각 수행하면서 기존 패치 주기 기반의 인간 중심 방어 메커니즘이 무력화되고 있습니다.
  • 생산성 향상을 위해 AI 에이전트에게 리포지토리 쓰기 권한과 내부 API 연결을 허용하면서 보안 인프라 깊숙한 곳에 새로운 공격 경로가 제공되었습니다.
  • IT와 OT의 통합으로 인해 기존의 네트워크 격리 및 방화벽 중심의 경계 보안 체계가 무너지며 중요 산업 자산까지 AI 에이전트 공격에 노출되었습니다.
Notable Quotes & Details
  • early 2026
  • CISA's KEV Catalog
  • EPSS

보안 담당자 및 기업 인프라 관리자

Cisco Unified CM Flaw Exploited After PoC Reveals File-Write Path to Root

Cisco Unified CM에서 공격자가 루트 권한을 획득할 수 있는 파일 쓰기 취약점(CVE-2026-20230)의 실제 악용 공격이 관측되었습니다.

  • Cisco Unified CM 및 Unified CM SME에서 unauthenticated remote SSRF를 통해 운영체제에 임의 파일을 작성하고 root 권한을 얻을 수 있는 CVE-2026-20230 취약점이 발견되었습니다.
  • 이 취약점을 실제로 성공적으로 악용하려면 기본값으로 비활성화되어 있는 WebDialer 서비스가 활성화되어 있어야 합니다.
  • Cisco는 Unified CM 14SU6 및 15SU5 버전에 취약점 패치를 배포하였으며, 패치 적용 전까지 WebDialer 서비스를 비활성화하는 임시 조치를 권장하고 있습니다.
Notable Quotes & Details
  • CVE-2026-20230
  • CVSS score: 8.6
  • 14SU6
  • 15SU5
  • CVE-2026-20262
  • CVSS score: 6.5

시스코 Unified CM 장비를 운영하는 네트워크 및 보안 관리자

[게시판] 퀄컴, ‘AI 이노베이터 프로그램 APAC’ 선정 스타트업 15개사 발표 등 단신

퀄컴의 스타트업 지원 프로그램 선정 발표, AI 해커톤 개최, 네이버클라우드와 지멘스의 제조 AI 협력 등 국내 주요 AI 산업 단신 모음입니다.

  • 퀄컴이 아태지역 엣지 AI 솔루션 개발 지원을 위해 '퀄컴 AI 이노베이터 프로그램 2026' 스타트업 15개사를 선정했습니다.
  • 앤트로픽 및 리플릿과 공동으로 서울에서 단시간 내 실제 작동하는 제품을 구현하는 AI 해커톤 '푸시 투 프로덕트 서울'을 개최했습니다.
  • 네이버클라우드가 한국지멘스와 협력하여 데이터센터 및 산업용 AI·DX 솔루션 결합을 통한 제조 산업의 AI 전환을 가속화합니다.
Notable Quotes & Details
  • 스타트업 총 15개사
  • 지난 18일
  • 175% 증가

국내외 AI 산업 동향, 기업 협력 소식 및 IT 트렌드에 관심이 있는 업계 관계자와 개발자

KAIST, 적은 데이터로 정밀 동작 구현하는 로봇 AI 개발…추론 효율까지 강화

KAIST 연구팀이 적은 양의 동작 데이터로 로봇의 정밀한 움직임을 생성하고 추론 효율을 높이는 다중 정밀도 조작 모델 '디스포(DiSPo)'를 개발했다.

  • 상태공간모델 '맘바'와 확산모델을 결합하여 필요에 따라 스스로 동작을 세분화하는 AI 기술 구현
  • 2단계 학습(사전학습 및 미세조정)을 통해 저주파 시연으로부터 시연에 없던 고주파 행동 패턴까지 효과적으로 학습
  • 추론 시 작업 핵심 구간에서는 정밀하게, 자유 공간에서는 저주파로 동작하여 효율성을 극대화하고 저주파(2.5Hz) 조건에서도 81% 이상의 성공률 유지
Notable Quotes & Details
  • 24일
  • 2.5–20Hz
  • 81%
  • 93%
  • 2.5밀리미터(mm)
  • 최대 4배
  • "데이터 수집 비용을 획기적으로 줄이면서도 정밀 제조와 의료 등 산업 현장에서 활용할 수 있는 범용 로봇 학습 기술로 발전시켜 나가겠다"

로봇 공학자, 제조 및 의료 산업 자동화 관계자, AI 연구원

딥시크, ‘하네스’ 팀 조직… 글로벌 AI 에이전트 시장 선점 가속화

딥시크가 AI 에이전트 시장 선점을 위해 '하네스(Harness)' 전담 조직을 신설하고 대규모 인재 채용에 나섰다.

  • 딥시크는 LLM을 자율적 업무 수행 도구로 발전시키기 위해 '하네스' 팀을 신설하고 대규모 채용을 진행 중이다.
  • 하네스는 LLM과 외부 도구, 실행 환경을 연결해 AI가 코딩, 웹 검색 등 복잡한 작업을 스스로 수행하도록 돕는 신경계 역할을 한다.
  • 딥시크는 독립형 AI 코딩 제품인 '딥시크 코드'의 전신이 될 수 있는 '코드하네스' 프로젝트를 처음부터 구축하고 있다.
Notable Quotes & Details
  • 21일(현지시간)
  • 올해 3월

AI 산업 동향 및 기술 트렌드에 관심이 있는 IT 업계 관계자와 개발자

오픈소스 이미지 모델 '크레아 2' 출시... "2초 만에 기업용 이미지 생성"

AI 이미지 생성 스타트업 크레아가 2초 만에 고해상도 이미지를 생성하고 커스터마이징이 용이한 오픈웨이트 이미지 모델 '크레아 2'를 출시했다.

  • 자체 개발 확산 트랜스포머 아키텍처 기반의 120억 개 매개변수를 갖춘 '크레아 2' 모델 공개
  • 커스터마이징을 위한 미조정 모델 '크레아 2 로우'와 2초 만에 2K 해상도 이미지를 생성하는 '크레아 2 터보' 배포
  • 개인과 중소기업은 상업적 무료 이용이 가능하나, 50석 초과 대기업은 별도 라이선스 필요 및 유해 콘텐츠 필터링 구현 의무화
Notable Quotes & Details
  • 2초
  • 23일(현지시간)
  • 120억개
  • 8단계
  • 2K 해상도
  • Train on Raw, Generate with Turbo
  • 50석(Seat)

기업용 맞춤 이미지 생성이 필요한 기업, 디자인 창작자 및 AI 모델 개발자

오픈AI, IPO 앞두고 광고 시장 조준…칸에서 챗GPT 광고 비즈니스 공개

오픈AI가 IPO를 앞두고 새로운 수익원 확보를 위해 칸 라이언즈에서 챗GPT 광고 비즈니스와 AI 코딩 에이전트 코덱스를 공개하며 광고 시장 공략에 나섰다.

  • 오픈AI는 메타 출신의 데이브 두건 글로벌 광고 사업 총괄의 주도하에 구글의 검색 광고 시장 지배력에 도전장을 내밀었다.
  • 챗GPT 무료 사용자 및 월 8달러 구독 상품인 '고(Go)' 이용자를 대상으로 광고가 노출되며, 전체 질의의 약 20%가 상업적 의도를 담고 있어 효과적인 플랫폼으로 홍보하고 있다.
  • 미국 등 일부 영어권 국가에서 중소기업용 셀프서비스 광고 플랫폼을 출시했으며, 투자자들에게 2030년까지 광고 사업을 1000억 달러 규모로 키우겠다는 전망을 제시한 것으로 알려졌다.
Notable Quotes & Details
  • 22일(현지시간)
  • 340억달러
  • 8달러
  • 20%
  • 2030년
  • 1000억 달러
  • "오픈AI는 시장에 완전히 새로운 것을 제공하고 있다"
  • "오픈AI는 광고 사업에 전적으로 전념하고 있다"
  • "광고 수익은 더 많은 사람들에게 정보 접근 기회를 제공하는 데 활용될 것"

IT 및 광고·마케팅 업계 종사자, 투자자

DJI, 여름 할인 행사… 첫 로봇청소기 ROMO 최대 30%·Neo·Osmo 특별가

글로벌 드론 및 카메라 기업 DJI가 로봇청소기 ROMO 시리즈 등 주요 제품을 최대 30% 할인 판매하는 여름 프로모션을 7월 5일까지 진행한다.

  • DJI가 첫 로봇청소기인 'DJI ROMO' 시리즈를 비롯해 드론, 액션 카메라 등 주력 제품의 할인 행사를 7월 5일까지 진행한다.
  • 물탱크 로봇청소기 버전인 ROMO P, S, A 전 모델에 최대 30% 할인이 적용되며 대표 모델 ROMO P는 1,940,000원에서 1,358,000원으로 인하된다.
  • Osmo 360(최대 25%), Osmo Pocket 3(약 10%), DJI Neo 단품(최대 18%) 등 영상 기기 및 드론 제품군도 특별가로 판매된다.
Notable Quotes & Details
  • 7월 5일
  • 최대 30%
  • 1,940,000원
  • 1,358,000원
  • 646,000원
  • 522,000원
  • 588,000원
  • 529,000원
  • 593,000원
  • 539,000원
  • 207,000원
  • 174,000원
  • 149,000원
  • 141,000원

가전제품 및 디지털 카메라, 드론 구매에 관심이 있는 일반 소비자 및 영상 크리에이터

엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

엔비디아와 AWS가 협력을 확대하여 블랙웰 기반의 신규 EC2 G7 인스턴스를 도입하고 아마존 오픈서치 서버리스에 엔비디아 cuVS를 적용해 AI 추론 및 벡터 검색 성능을 대폭 강화했다.

  • RTX 프로 4500 블랙웰 기반의 아마존 EC2 G7 인스턴스를 통해 기존 대비 AI 추론 성능을 최대 4.6배, 그래픽 성능을 최대 2.1배 향상시켰다.
  • 아마존 오픈서치 서버리스에 엔비디아 cuVS를 적용하여 검색증강생성(RAG) 및 에이전틱 AI 등을 위한 GPU 가속 벡터 인덱싱을 기본 탑재했다.
  • cuVS 도입으로 벡터 인덱싱 속도가 CPU 대비 최대 10배 빨라지고, 인프라 비용은 4분의 1 수준으로 절감할 수 있게 되었다.
Notable Quotes & Details
  • 24일
  • 최대 4.6배
  • 최대 2.1배
  • 최대 8개 GPU
  • 총 256기가바이트(GB)
  • 초당 700기가비트(Gbps)
  • 최대 7.6테라바이트(TB)
  • 최대 10배
  • 4분의 1
  • 1시간
  • 이번 협력은 AWS의 AI 인프라 계층 전반을 강화하는 데 초점을 맞췄다

클라우드 기반 인프라를 활용하여 AI 모델을 개발·배포하거나 대규모 벡터 검색 및 렌더링 작업을 수행하려는 기업 고객 및 개발자

"글자 위치·역할까지 파악"…미스트랄AI, 차세대 OCR 모델 출시

미스트랄AI가 글자 위치, 역할 구분 및 신뢰도 측정 기능을 갖춘 차세대 OCR 모델 '미스트랄 OCR 4'를 출시했다.

  • 단순 텍스트 추출을 넘어 바운딩 박스를 통한 글자 위치 표시와 제목, 표, 수식, 서명 등의 블록 분류 기능을 지원한다.
  • PDF, DOC, PPT 등 다양한 문서 형식과 170개 언어를 지원하며, 기업의 데이터 보안을 위한 자체 호스팅(단일 컨테이너 배포) 기능을 제공한다.
  • 공개 벤치마크인 OlmOCRBench에서 85.20점, OmniDocBench에서 93.07점을 기록하며 높은 성능을 입증했다.
Notable Quotes & Details
  • 24일
  • 미스트랄 OCR 4
  • 170개
  • 72%
  • 85.20점
  • 93.07점
  • 1000 페이지당 4달러
  • 50% 할인
  • 1000 페이지당 2달러

인공지능(AI) 기반 문서 검색 및 에이전트 서비스를 개발·도입하려는 기업 고객 및 개발자

[ZD SW 투데이] 큐빅, 가트너 보고서 2년 연속 등재 外

국내 주요 소프트웨어 및 AI 기업들이 신기술 보고서 등재, 세미나 개최, 연구 성과 공유 및 금융 지원 선정 등 다양한 비즈니스 소식을 전했다.

  • 큐빅이 가트너의 에이전틱 AI 활용 사례 보고서에 2년 연속 등재되며 보안 위협 탐지 및 자율 네트워크 기술력을 입증했다.
  • 메가존소프트가 구글 클라우드와 공동 세미나를 열고 AI 에이전트를 기업 프로세스에 통합하는 에이전틱 WX 전략과 도입 사례를 제시했다.
  • 한국딥러닝이 신용보증기금의 프리아이콘에 선정되어 3년간 최대 70억 원의 보증 지원 혜택을 확보했다.
Notable Quotes & Details
  • 2년 연속
  • T 챌린지 2026
  • C레벨 임원 60여명
  • 34개 논문
  • 3년간 최대 70억원
  • 80여개 고객사

국내 IT·SW 비즈니스 리더, AI 기술 도입을 희망하는 기업 의사 결정자, 정보통신 기술 연구자

Jooojub
System S/W engineer
Explore Tags
Series
    Recent Post
    © 2026. jooojub. All right reserved.