Daily Briefing

April 26, 2026
2026-04-25
37 articles

Porsche built one of the best electric SUVs ever made, and does not expect the world to buy enough of them

포르쉐가 역사상 가장 강력한 전기 SUV인 카이엔 쿠페 일렉트릭을 공개했으나, 회사의 재정 악화와 EV 시장에 대한 회의적인 시각으로 인해 판매 전략에 신중한 태도를 보이고 있습니다.

  • 포르쉐는 베이징 오토 차이나에서 1,139마력의 카이엔 쿠페 일렉트릭을 공개했다.
  • 이 차량은 0-60mph 2.4초, WLTP 기준 669km 주행거리, 16분 고속 충전 성능을 가졌다.
  • 포르쉐는 93% 영업이익 감소와 CEO 교체 등 최악의 한 해를 보냈다.
  • 2030년까지 EV 판매 80% 목표를 철회하고 ICE 및 PHEV 모델을 계속 판매할 계획이다.
  • 프리미엄 EV 시장이 예상보다 작다는 판단이 이러한 전략 변경의 배경이다.
Notable Quotes & Details
  • 1,139 hp
  • 0-60mph in 2.4 seconds
  • 669 km WLTP range
  • 16-minute fast charging
  • $113,800
  • 93% operating profit decline
  • 80% EV-by-2030 target

자동차 애호가, EV 시장 분석가, 일반 독자

The Stanford professor behind an FDA-cleared cardiac AI wants $1 billion for his next company

스탠포드 제임스 주(James Zou) 교수가 FDA 승인 심장 AI를 개발했으며, 인체 연구에 AI를 적용하는 새로운 회사인 Human Intelligence를 위해 10억 달러 가치에 1억 달러 투자를 유치 중입니다.

  • 제임스 주 교수는 FDA 승인 심장 AI(EchoNet)를 개발했다.
  • 그의 연구는 네이처에 발표된 가상 연구실, 가상 바이오텍 다중 에이전트 프레임워크 등을 포함한다.
  • 가상 연구실은 92개의 새로운 나노바디 결합체를 설계했다.
  • 가상 바이오텍은 56,000건의 임상 시험을 분석하여 약물 성공률과 부작용 감소 관련 데이터를 도출했다.
  • Human Intelligence는 인체 연구에 AI를 적용할 예정이며, 10억 달러 가치로 1억 달러 투자를 유치 중이다.
Notable Quotes & Details
  • $1 billion valuation
  • $100 million
  • FDA-cleared cardiac AI
  • 92 novel nanobody binders
  • 56,000 clinical trials
  • 48% more likely to reach market
  • 32% lower adverse event rates
  • $11 billion into AI drug discovery in Q1 2026

AI 연구자, 의료 및 제약 산업 관계자, 벤처 투자가

Meta signs multibillion-dollar deal for Amazon Graviton5 chips as AI compute demand outstrips $135B capex budget

메타가 AI 연산 수요 충족을 위해 아마존 웹 서비스의 Graviton5 ARM CPU 코어 수천만 개를 사용하는 수십억 달러 규모의 다년 계약을 체결했습니다.

  • 메타는 에이전트 AI 워크로드를 위해 아마존의 Graviton5 ARM CPU 코어 사용 계약을 맺었다.
  • Graviton5 칩은 AI 가속기가 아닌 범용 프로세서로, AI 추론 및 오케스트레이션에 사용된다.
  • 메타는 엔비디아, AMD 등 여러 기업과 2천억 달러 이상의 조달 캠페인을 진행 중이다.
  • 이는 메타의 AI 연산 수요가 단일 공급망만으로는 충족될 수 없음을 반영한다.
  • 아마존은 메타의 직접적인 경쟁사임에도 불구하고 이러한 계약이 이루어졌다.
Notable Quotes & Details
  • multibillion-dollar, multi-year deal
  • tens of millions of Amazon’s Graviton5 ARM CPU cores
  • exceeding $200 billion
  • $50B (Nvidia)
  • $60B (AMD)
  • $35B (CoreWeave)
  • $27B (Nebius)
  • $115 billion to $135 billion (capital expenditure this year)

AI 산업 관계자, 투자자, 기술 기업 경영진

Meta is firing 8,000 people. Microsoft is paying 8,750 to leave. Both are spending the savings on AI.

메타와 마이크로소프트가 총 23,000명에 달하는 대규모 인력 감축을 발표했으며, 이는 인건비를 절감하여 AI 인프라 투자에 집중하기 위한 전략으로 풀이됩니다.

  • 메타는 8,000명 해고 및 6,000개 공석 취소, 마이크로소프트는 8,750명 대상 자발적 퇴직 프로그램을 발표했다.
  • 두 회사 모두 역대 최고 매출을 기록했으며, AI 인프라에 막대한 투자를 하고 있다.
  • 이번 감축은 재정적 어려움 때문이 아니라 AI 자본 지출을 위한 인건비 대체 목적이다.
  • 2026년 현재까지 96,000명의 기술직 직원이 이러한 패턴으로 영향을 받았다.
  • 메타는 2026년 자본 지출로 1,150억~1,350억 달러를 예상하고 있다.
Notable Quotes & Details
  • 8,000 jobs
  • 10% of staff
  • 6,000 open roles
  • 8,750 US employees
  • 23,000 positions combined
  • 96,000 tech workers in 2026
  • $115 billion to $135 billion (Meta's capital expenditure for 2026)
  • $72 billion (Meta spent in 2025)

기술 산업 종사자, 경제 분석가, 투자자

From web to Artificial Intelligence: Building the missing links

웹 인텔리전스 산업이 멀티모달 AI 데이터 인프라 구축의 핵심 역할을 하며, AI 기술 발전에 기여하고 있다.

  • 웹 인텔리전스 산업은 AI 발전에 필요한 데이터 인프라를 제공한다.
  • AI 기업들은 2025년부터 오디오 및 비디오 데이터 처리가 가능한 멀티모달 도구 개발에 주력하고 있다.
  • 멀티모달 데이터는 텍스트보다 처리하기 어렵고 방대한 자원을 요구하며, 윤리적 데이터 확보가 중요하다.
  • Video Data API는 관련 영상 및 채널을 찾아 메타데이터를 추출하여 AI 연구소로 데이터를 빠르게 전송한다.
Notable Quotes & Details
  • 2025
  • Video Data API

AI 산업 관계자, 데이터 인프라 개발자, 비즈니스 리더

Apple under Ternus: what comes next for the tech giant’s hardware strategy

존 터너스 신임 CEO의 리더십 아래 애플이 AI 경쟁력 강화를 위해 하드웨어 중심 전략으로 전환하며, AI 기반 기기 개발에 집중할 것으로 예상된다.

  • 존 터너스가 팀 쿡의 뒤를 이어 애플 CEO로 취임할 예정이다.
  • 터너스는 오랜 하드웨어 전문가로서 애플의 AI 전략을 하드웨어 중심(AI 탑재 기기)으로 전환할 가능성이 크다.
  • 애플은 스마트 안경, 카메라가 내장된 웨어러블 펜던트, AI 기능이 있는 에어팟 등 새로운 AI 기기를 구상 중이다.
  • 폴더블 아이폰과 가정용 로봇 등 지연된 제품 개발도 가속화될 것으로 보인다.
Notable Quotes & Details
  • $4 trillion
  • 2001
  • September

기술 산업 분석가, 애플 투자자, IT 제품 개발자

Google DeepMind Introduces Vision Banana: An Instruction-Tuned Image Generator That Beats SAM 3 on Segmentation and Depth Anything V3 on Metric Depth Estimation

구글 딥마인드가 이미지 생성 모델 '비전 바나나(Vision Banana)'를 공개하며, 이 모델이 이미지 생성과 시각적 이해 작업을 동시에 수행하여 기존 전문 시스템들을 능가하거나 동등한 성능을 보임을 발표했다.

  • 컴퓨터 비전 분야의 생성 모델과 판별 모델 간의 기존 경계를 허물었다.
  • Vision Banana는 단일 통합 모델로, 이미지 생성과 다양한 시각적 이해 작업(의미론적 분할, 깊이 추정 등)을 모두 수행한다.
  • 기존 LLM의 사전 학습-명령 튜닝 방식과 유사하게, 이미지 생성 학습이 시각 인식을 위한 기초적 역할을 한다는 통찰에서 출발했다.
  • Nano Banana Pro(NBP)를 기반으로 경량 명령 튜닝을 통해 Vision Banana를 개발했다.
Notable Quotes & Details
  • Vision Banana
  • SAM 3
  • Depth Anything V3
  • arXiv:2604.20329
  • 2026-04-22
  • Nano Banana Pro (NBP)

AI 연구자, 컴퓨터 비전 연구자, 머신러닝 개발자

Meet GitNexus: An Open-Source MCP-Native Knowledge Graph Engine That Gives Claude Code and Cursor Full Codebase Structural Awareness

GitNexus는 AI 코딩 에이전트에게 코드베이스의 구조적 이해를 제공하는 오픈소스 지식 그래프 엔진으로, 코드 변경 시 발생할 수 있는 오류를 줄이는 데 도움을 준다.

  • 기존 AI 코딩 에이전트는 코드의 종속성 관계를 파악하지 못해 오류를 발생시키는 문제가 있었다.
  • GitNexus는 전체 저장소를 구조화된 지식 그래프로 인덱싱하여 함수 호출, 상속, 실행 흐름 등을 매핑한다.
  • Model Context Protocol (MCP) 서버를 통해 이 지식 그래프를 AI 에이전트에 노출하여 정확한 쿼리를 가능하게 한다.
  • AI 에이전트는 GitNexus를 통해 코드 종속성을 사전에 인지하고, 예측 가능한 방식으로 코드를 수정할 수 있다.
Notable Quotes & Details
  • 28,000+ stars
  • 3,000+ forks
  • 45 contributors
  • Model Context Protocol (MCP)

AI 개발자, 소프트웨어 엔지니어, 코드 에이전트 연구자

A Coding Implementation on Deepgram Python SDK for Transcription, Text-to-Speech, Async Audio Processing, and Text Intelligence

딥그램 파이썬 SDK를 활용하여 음성 AI 기능을 통합한 고급 워크플로우 구현 방법에 대한 튜토리얼입니다.

  • 딥그램 파이썬 SDK를 사용하여 동기 및 비동기 클라이언트를 설정하고 인증합니다.
  • URL 및 로컬 파일에서 오디오를 전사하고, 신뢰도 점수, 단어 수준 타임스탬프, 화자 분리, 단락 서식 및 AI 생성 요약을 검사합니다.
  • 비동기 처리를 통해 더 빠르고 확장 가능한 실행을 가능하게 하여 파이프라인을 확장합니다.
  • 여러 TTS 음성으로 음성을 생성하고, 감정, 주제 및 의도를 분석합니다.
  • 키워드 검색, 교체, 부스팅, 원시 응답 액세스 및 구조화된 오류 처리와 같은 고급 전사 제어를 탐색합니다.
Notable Quotes & Details

개발자, 엔지니어, 음성 AI 기술에 관심 있는 사람

A Coding Implementation on Microsoft’s OpenMementos with Trace Structure Analysis, Context Compression, and Fine-Tuning Data Preparation

Microsoft의 OpenMementos 데이터셋을 사용하여 추론 트레이스 분석, 컨텍스트 압축 및 미세 조정을 위한 데이터 준비 방법을 다루는 코딩 구현 튜토리얼입니다.

  • Microsoft OpenMementos 데이터셋을 효율적으로 스트리밍하고 특수 토큰 형식을 파싱합니다.
  • 추론 및 요약이 어떻게 구성되는지 검사하고, 다양한 도메인에서 밈 표현에 의해 제공되는 압축률을 측정합니다.
  • 데이터셋 패턴을 시각화하고 스트리밍 형식을 더 풍부한 전체 하위 집합과 정렬하며 추론 시간 압축을 시뮬레이션합니다.
  • 감독 학습 미세 조정을 위한 데이터를 준비하여 OpenMementos가 긴 형식의 추론을 캡처하고 효율적인 훈련 및 추론을 지원하는 컴팩트한 요약을 보존하는 방법을 이해합니다.
Notable Quotes & Details

AI 연구자, 개발자, 머신러닝 엔지니어

Gemini Enterprise Agent Platform — 구글 클라우드의 차세대 AI 에이전트 통합 플랫폼

구글 클라우드가 기존 Vertex AI를 확장하여 AI 에이전트의 개발, 확장, 제어, 최적화 전 과정을 지원하는 차세대 통합 플랫폼인 'Gemini Enterprise Agent Platform'을 공식 출시했습니다.

  • 기존 Vertex AI의 모든 서비스와 로드맵이 Gemini Enterprise Agent Platform을 통해 제공될 예정입니다.
  • Agent Studio (로우코드)와 ADK (코드 중심)를 통해 개발자 숙련도에 맞는 에이전트 개발 경로를 제공합니다.
  • Agent Runtime은 서브 세컨드 콜드 스타트와 장기 워크플로우 처리를 지원하여 영업 리드 관리와 같은 복합 작업에 적합합니다.
  • Memory Bank는 대화에서 장기 기억을 자동 생성/관리하여 개인화된 상호작용을 가능하게 합니다.
  • Agent Identity, Registry, Gateway를 통해 에이전트의 보안 및 거버넌스를 강화합니다.
  • Agent Simulation, Evaluation, Observability 기능을 통해 배포 전 테스트, 자동 평가, 실시간 추론 흐름 시각화를 제공합니다.
  • Agent Optimizer는 실패 패턴을 자동 클러스터링해 개선된 시스템 지시문을 제안합니다.
  • Model Garden을 통해 200개 이상의 모델에 접근 가능하며, 구글 자체 모델과 서드파티 모델을 모두 지원합니다.
  • Agent Sandbox, Anomaly Detection, Threat Detection, Security 대시보드를 통해 에이전트 보안을 강화합니다.
Notable Quotes & Details
  • Gemini 3.1 Pro, Gemini 3.1 Flash Image, Lyria 3, Gemma 4
  • 200개 이상의 모델
  • Comcast: ADK로 Xfinity Assistant를 재구축

기업 IT 관리자, AI 솔루션 개발자, 클라우드 아키텍트, 비즈니스 의사 결정권자

ClawSweeper: AI 기반 오픈소스 이슈 자동 관리 봇

ClawSweeper는 AI 기반 오픈소스 이슈 자동 관리 봇으로, 13,000개 이상의 미처리 이슈와 PR을 OpenAI Codex(gpt-5.4)를 활용하여 검토하고 닫을 수 있는 항목과 유지할 항목을 분류하는 도구입니다.

  • "확실하지 않으면 닫지 않는다"는 보수적 원칙에 따라 설계되었습니다.
  • 계획, 검토, 적용의 3단계 파이프라인으로 운영되며, 검토 단계에서는 OpenAI Codex(gpt-5.4)를 사용합니다.
  • 닫기 제안 조건은 이미 구현, 재현 불가능, 별도 플러그인 이관, 내용 불명확, 60일 이상 방치 및 정보 부족으로 5가지로 제한됩니다.
  • 7일간 검토 완료 항목 중 이슈의 약 33.7%, PR의 약 11.4%가 닫기 후보로 분류되었고 3,907개가 정리되었습니다.
  • TypeScript 단일 파일로 구성되어 외부 의존성이 적고, Go 기반 tsgo와 Rust 기반 oxlint·oxfmt를 사용하여 빌드 속도를 높였습니다.
  • AI가 메인테이너를 대체하는 것이 아니라, 명확한 근거가 있는 항목만 처리하고 나머지 판단은 사람에게 맡기는 방식입니다.
Notable Quotes & Details
  • 13,000개 이상의 미처리 항목
  • OpenAI Codex(gpt-5.4)
  • 이슈의 약 33.7%, PR의 약 11.4%가 닫기 후보로 분류
  • 실제 3,907개가 정리
  • TypeScript 단일 파일 약 2,500줄

오픈소스 프로젝트 관리자, 개발자, AI 기반 도구에 관심 있는 사람

AI 알약을 먹은 복리 성장 스타트업

AI 네이티브 스타트업들이 제품 관리자(PM) 역할의 소멸과 엔지니어 중심의 운영 모델로 전환하며 기존 스타트업과 다른 운영 방식을 보이고 있다.

  • 전담 PM이 거의 없으며, 엔지니어가 고객과 직접 소통하며 제품 결정을 전담한다.
  • AI 활용으로 실험 속도가 3~5배 빨라져 기업 간 격차가 심화되고 있다.
  • Slack, Claude Code, GitHub, Codex, Linear를 주요 기술 스택으로 사용하며, Slack이 에이전트 오케스트레이션의 핵심 허브 역할을 한다.
  • AI가 엔지니어 외 모든 사람의 업무 (회계, 마케팅, 리서치 등)를 자동화하여 생산성을 높이고 있다.
  • 실행 비용이 거의 제로에 가까워지면서 '취향(taste)'이 중요해지고 있으나, 이를 조직적으로 구현하는 방법은 아직 모색 중이다.
Notable Quotes & Details
  • 40명 규모 기업에서도 전담 PM 1명
  • Slack AI 에이전트 요청 시 1시간 만에 해결
  • Chief of Staff가 30분 이내 다이렉트 메일 및 마케팅 자료 제작

스타트업 관계자, AI 기술 도입을 고려하는 기업, 엔지니어, 제품 관리자

Show GN: purplemux – Claude Code 세션을 웹·모바일에서 관리하는 오픈소스 tmux 매니저

purplemux는 Claude Code 세션을 웹 및 모바일에서 관리하고 알림을 받을 수 있는 오픈소스 tmux 세션 매니저이다.

  • 웹/모바일에서 tmux 기반 세션 상태를 확인하고 완료 알림을 받을 수 있다.
  • 멀티 세션 대시보드를 통해 워크스페이스, 그룹, 탭 단위 관리 및 상태 확인이 가능하다.
  • Claude Code/CLI 에이전트를 자주 사용하거나 자리를 비우는 사용자에게 유용하다.
  • macOS용 DMG를 제공하며 npx purplemux로 쉽게 실행할 수 있다.
Notable Quotes & Details
  • 기본 포트 8022
  • GitHub(MIT)

개발자, 엔지니어, Claude Code/CLI 에이전트 사용자

Show GN: imgssh - SSH 안에서 로컬 클립보드 이미지를 붙여넣기

imgssh는 SSH 환경에서 로컬 클립보드의 이미지를 원격 서버에 쉽게 붙여넣고 경로를 입력해주는 도구이다.

  • 원격 SSH 세션에서 Claude Code나 Codex와 같은 터미널 도구 사용 시 이미지 삽입의 번거로움을 해소한다.
  • 로컬 클립보드 이미지를 Ctrl+] 단축키로 원격 /tmp에 업로드하고 파일 경로를 자동으로 입력한다.
  • SSH 자체를 감싸는 방식으로 작동하여 여러 탭에서 각각의 imgssh 프로세스가 해당 세션만 처리한다.
  • 중첩된 SSH 환경에서는 바깥쪽 SSH 세션으로만 이미지를 업로드한다.
Notable Quotes & Details
  • GitHub: https://github.com/coderredlab/imgssh

개발자, 시스템 관리자, Claude Code/Codex 등 터미널 도구 사용자

How to find to 'collaborate' with Professors to get funding for my research papers? [D]

한 연구자가 재정적인 어려움으로 학회 참가 등록을 포기한 후, 연구비 지원 및 공동 저자를 찾기 위해 교수들과의 협업 방안을 모색하고 있다.

  • 연구 논문이 주요 학회 워크숍 또는 본 학회에 게재될 수준이라 생각하지만, 단독 저자로서 등록비를 감당하기 어렵다.
  • 인도의 고아로 재정적 어려움을 겪고 있으며, 연구비 지원에 도움을 줄 공동 저자를 찾고 있다.
  • 본인(Erika_bomber)을 주 저자로 유지하고 연구 내용에 큰 변경을 요구하지 않는 교수를 선호한다.
  • 유럽/미국 대학 교수 또는 관련 기관과의 협력을 희망하며, 소속 대학 사람들과는 신뢰 문제가 있다.
Notable Quotes & Details
  • CVPR Archival Workshop

AI 연구자, 학계 교수, 연구 펀딩 기관

How would you build an automated commentary engine for daily trade attribution at scale? [R]

시장 위험 보고를 위한 자동화된 주석 엔진 구축에 대한 논의로, 결정론적 수학적 정밀도와 동적 자연어 생성 간의 균형을 맞추는 방법에 초점을 맞춥니다.

  • 시장 위험 보고를 위한 자동화된 주석 엔진 구축 필요성.
  • 수학적 정밀도(Python 및 Polars 사용)와 동적 자연어 생성(LLM 사용)의 균형 문제.
  • Agentic 워크플로우(LLM이 Polars/pandas 코드 실행) 또는 사전 계산된 큐브 및 구조화된 컨텍스트 프롬프트 사용 여부에 대한 질문.
  • 금융 보고 분야에서 LangChain, LlamaIndex, PandasAI 등의 프레임워크와 디자인 패턴에 대한 인사이트 요청.
Notable Quotes & Details
  • "The portfolio variance today was +$50k, driven primarily by a shift in the Equities asset class, with the largest single contributor being Trade XYZ."

AI 개발자, 머신러닝 엔지니어, 금융 분석가

Open-source 9-task benchmark for coding-agent retrieval augmentation. Per-task deltas +0.010 to +0.320, all evals reproducible [P]

코딩 에이전트의 검색 증강 기술 선택 성능을 측정하는 9가지 작업 벤치마크 스위트인 'paper-lantern-challenges'가 오픈 소스로 공개되었습니다.

  • 코딩 에이전트의 검색 증강 성능을 평가하는 오픈 소스 벤치마크 'paper-lantern-challenges' 출시.
  • 9가지 일상적인 소프트웨어 작업에 걸쳐 성능 측정, 각 작업별 0.010에서 0.320까지의 성능 향상.
  • 모든 평가(테스트 생성, text-to-SQL, PDF/계약 추출, PR 검토, 텍스트 분류 등)는 재현 가능.
  • 평가 방법론 및 데이터셋은 레포에 상세히 설명되어 있으며, 무료 Gemini API 키로 약 10분 내에 평가 가능.
Notable Quotes & Details
  • Claude Opus 4.6 (플래너), Gemini Flash 3 (태스크 모델)
  • per-task deltas +0.010 to +0.320

AI 연구자, 코딩 에이전트 개발자

Notes: 벤치마크 개발자가 검색 시스템('paperlantern.ai/code')의 저자임을 공개

We released an open source tool that handles AI agent setup and config. 700 stars and growing. What features do you want to see?

AI 에이전트 설정 및 구성을 처리하는 오픈 소스 도구 'Caliber'가 출시되었으며, 커뮤니티로부터 피드백을 요청하고 있습니다.

  • AI 에이전트 설정 및 구성의 어려움을 해결하기 위한 오픈 소스 도구 'Caliber' 출시.
  • 일관된 에이전트 설정과 환경 간 격차 해소에 중점.
  • GitHub에서 700개 이상의 별을 획득하고 약 100회 포크.
  • AI 시스템 작업자들의 피드백을 통해 추가 기능 및 개선 사항 모색.
Notable Quotes & Details
  • 700 GitHub stars
  • almost at 100 forks

AI 에이전트 개발자, AI 시스템 관리자

Got into the Anthropic Claude Partner Network — have spots for people who want CCAF cert access

Anthropic Claude 파트너 네트워크에 가입한 개인이 CCAF(Claude Certified Agent Foundry) 인증 액세스를 위한 참가자를 모집하고 있습니다.

  • Anthropic Claude 파트너 네트워크 가입.
  • CPN 학습 경로 이수를 위해 10명의 조직 도메인 구성원 필요.
  • 학습 경로는 Agent Skills, Claude API, MCP, Claude Code in Action 등 4개 코스로 구성.
  • 파트너 조직 구성원은 CCAF 시험에 무료로 응시 가능하며, 과정은 자율 학습으로 진행.
Notable Quotes & Details
  • 10 people under our org’s domain
  • 4 courses on Anthropic Academy

Claude 개발자, AI 관련 기업 종사자

Notes: 홍보성 콘텐츠로 보일 수 있음

GPT-5.5: 'strongest agentic coding model ever' failing spectacularly at its own game (LiveBench)

OpenAI의 GPT-5.5 모델이 에이전트 코딩 능력 벤치마크인 LiveBench에서 이전 버전 및 경쟁 모델에 비해 저조한 성능을 보여, 홍보 문구와는 상반되는 결과를 보였다.

  • OpenAI는 GPT-5.5를 "가장 강력한 에이전트 코딩 모델"로 홍보하며 새로운 구독 티어까지 만들었다.
  • 하지만 독립적인 LiveBench 테스트에서 GPT-5.5는 56.67점을 기록하며 이전 모델인 GPT-5.4(70.00점)보다 낮았다.
  • Gemini 3.1 Pro, Claude 4.6 등 경쟁 모델들도 GPT-5.5를 쉽게 능가했다.
  • GPT-5.5는 자체 벤치마크에서는 높은 점수를 받았으나, 외부 벤치마크에서는 부진했다.
Notable Quotes & Details
  • "GPT‑5.5 is our strongest agentic coding model to date."
  • "The gains are especially strong in agentic coding."
  • "Instead of carefully managing every step, you can give GPT‑5.5 a messy, multi-part task and trust it to plan, use tools, check its work, navigate through ambiguity, and keep going."
  • "LiveBench’s independent agentic coding score, this is just a lot of hot air. The score for GPT-5.5 xHigh Effort is 56.67. Its predecessor, GPT-5.4, thrashes it at 70.00 on the same benchmark. Gemini 3.1 Pro, Claude 4.6 and others easily outperform it, too."

AI 개발자, AI 연구자, AI 모델 성능 비교에 관심 있는 일반 독자

What AI models/companies you think is best value?

AI 구독 서비스 사용자들 사이에서 어떤 AI 모델/회사가 가격 대비 최고의 가치를 제공하는지에 대한 논의가 이루어지고 있다.

  • 기존 사용자들은 Perplexity PRO와 Google One에 포함된 Gemini를 사용하고 있다.
  • Anthropic 모델은 성능이 저하되는 경향이 있다는 우려가 있다.
  • OpenAI는 가격이 비싸고 연간 할인 플랜이 부족하다는 지적이 있다.
  • Kimi는 결제 문제와 정보 부족으로 인해 사용자들이 망설이고 있다.
  • 최근 AI 회사들의 변화 속에서 가성비 좋은 모델을 찾고자 하는 수요가 있다.
Notable Quotes & Details

AI 서비스 사용자, AI 기술 투자에 관심 있는 일반 독자

WHY AI ALIGNMENT IS ALREADY FAILING

AI 정렬(alignment)의 현재 실패 원인을 분석하고, 기존 AI 안전 패러다임이 다루지 못하는 위험성을 설명하는 기고문이다.

  • 2022년 Collaborations Pharmaceuticals의 MegaSyn AI가 독성 패널티 기능을 반전시키자 40,000개의 새로운 화학 무기를 생성한 사례를 언급하며 AI 시스템의 방향 전환 위험성을 강조한다.
  • AI 시스템이 본질을 바꾸지 않고도 목적을 바꿀 수 있음을 지적한다.
  • AI 안전 논의가 최근 발견된 세 가지 중요한 연구 결과(프론티어 모델의 자기 보존 행동, 정확한 세계 모델링, 통제 외부의 능력 발휘)의 함의를 놓치고 있다고 주장한다.
  • AI 정렬과 통제가 안정적인 상태가 아니며, 미래의 초지능에 대한 가설이 아닌 현재 시스템의 문제로 보아야 한다고 강조한다.
Notable Quotes & Details
  • "In 2022, researchers at Collaborations Pharmaceuticals demonstrated something that received almost no public attention. Their drug discovery AI, MegaSyn, was designed to screen molecules for therapeutic potential by penalizing toxicity. A team of researchers, curious about the system's dual-use potential, flipped a single sign in the reward function. Penalize toxicity became maximize toxicity. In six hours, MegaSyn produced 40,000 novel chemical weapons"
  • "We can easily erase the thousands of molecules we created, but we cannot delete the knowledge of how to recreate them."

AI 연구자, AI 윤리 전문가, 정책 입안자

Notes: 원문이 잘려있어 전체 내용을 파악하기 어려움

Qwen3.6-27B at ~80 tps with 218k context window on 1x RTX 5090 served by vllm 0.19

Qwen3.6-27B 모델이 단일 RTX 5090 GPU에서 vLLM 0.19를 통해 약 80 tps의 속도와 218k 컨텍스트 윈도우로 구동되는 성능을 시연했다.

  • Qwen3.6-27B 모델이 NVFP4와 MTP와 함께 Hugging Face에 공개되었다.
  • vLLM 0.19를 사용하여 단일 RTX 5090에서 218k 컨텍스트 윈도우로 약 80 tps의 인상적인 처리량을 달성했다.
  • 이는 이전 Qwen3.5-27B 모델에서도 유사한 성능을 보인 바 있다.
  • 로컬 LLM 배포 및 최적화에 대한 기술적 진전을 보여준다.
Notable Quotes & Details
  • "Qwen3.6-27B"
  • "~80 tps"
  • "218k context window"
  • "1x RTX 5090"
  • "vllm 0.19"
  • "NVFP4"
  • "MTP"

LLM 개발자, ML 엔지니어, 로컬 AI 모델 배포에 관심 있는 기술 전문가

I'm glad we have deepseek

DeepSeek이 다른 AI 기업들과 달리 오픈 가중치 모델 공개와 연구 발표를 꾸준히 이어가며 AI 기술 발전에 중요한 기여를 하고 있다는 내용입니다.

  • 다른 AI 기업들은 오픈 가중치 모델 공개를 줄이거나 지연하며 연구 발표를 블로그 게시물로 대체하고 있습니다.
  • DeepSeek은 매달 혁신적인 연구 결과를 발표하고, 베이스 모델과 오픈 가중치를 즉시 공개하며, 모델 훈련 및 아키텍처를 상세히 설명합니다.
  • DeepSeek은 AI 분야에서 기술과 효율성을 발전시키는 데 중요한 역할을 합니다.
  • 단점으로는 소형 모델을 출시하지 않는다는 점이 언급됩니다.
Notable Quotes & Details

AI 연구자, 오픈 소스 모델 커뮤니티 개발자

Decreased Intelligence Density in DeepSeek V4 Pro

DeepSeek V4 Pro의 토큰 효율성이 이전 버전인 V3.2보다 저하되었으며, 동일 성능을 위해 GPT-5.4/5.5 대비 약 10배 더 많은 토큰을 필요로 한다는 분석입니다.

  • DeepSeek V3.2 논문에서 토큰 효율성이 과제로 언급되었고, V4 Pro에서는 이 문제가 더욱 심화되었습니다.
  • V4 Pro는 V3.2(0.67T)보다 약 2.5배 큰 1.6T 모델임에도 불구하고 토큰 효율성이 감소했습니다.
  • GPT-5.4/5.5와 비교 시, DeepSeek V4 Pro는 유사한 성능을 위해 약 10배 많은 토큰을 사용합니다.
  • 이는 동일한 작업 완료에 약 10배 더 긴 시간을 의미합니다.
Notable Quotes & Details
  • DeepSeek-V4 Pro (1.6T)
  • DeepSeek-V3.2 (0.67T)
  • 10x more tokens
  • 10x longer

AI 모델 개발자, AI 연구자

🛡️ Shield 82M: A PII stripping/filtering model 🛡️

개인 식별 정보(PII)를 모든 언어의 텍스트에서 필터링하고 제거할 수 있는 오픈 소스 모델인 Shield 82M이 출시되었다는 소식입니다.

  • Shield 82M은 distilroberta-base를 미세 조정하여 개발된 PII 필터링 모델입니다.
  • 이 모델은 이름, 이메일, 전화번호, 주소 등 다양한 PII를 감지하고 대체할 수 있습니다.
  • 다국어 지원 기능을 통해 프랑스어 텍스트에서도 PII를 효과적으로 처리합니다.
  • 약 96%의 정확도를 보이며, 완전히 오픈 소스로 제공됩니다.
Notable Quotes & Details
  • Shield 82M
  • ~96% accuracy

개발자, 데이터 과학자, 개인 정보 보호에 관심 있는 사용자

Throughput and TTFT comparisons of Qwen 3.6 27B, Qwen 3.6 35B A3B and Gemma 4 models on H100

H100 GPU에서 Qwen 3.6 및 Gemma 4 모델들의 처리량(throughput) 및 첫 토큰 생성 시간(TTFT)을 비교 벤치마킹한 결과, 소형 Gemma expert 모델과 FP8 양자화의 효율성이 두드러졌다는 내용입니다.

  • H100 GPU에서 8가지 모델을 vLLM 벤치마크를 통해 처리량과 TTFT를 측정했습니다.
  • 소형 Gemma expert 모델(Gemma 4 E2B-it)이 16 동시 사용자 환경에서 3,180 TPS로 압도적인 성능을 보였습니다.
  • FP8 양자화는 MoE 모델(Qwen 3.6 35B MoE)에서 BF16 대비 73% 빠른 속도를 보여, 메모리 절약뿐 아니라 성능 향상에도 기여했습니다.
  • Gemma 31B dense 모델은 단일 GPU에서 로드 발생 시 성능이 급격히 저하되므로, 높은 동시성을 위해서는 MoE 모델을 추천합니다.
Notable Quotes & Details
  • H100 80GB
  • vLLM 0.19.1
  • 128 input tokens
  • 128 output tokens
  • Gemma 4 E2B-it pushed 3,180 TPS
  • Gemma 4 31B dense managed only 226
  • FP8 quantization was 73% faster than BF16

AI 모델 연구자, 시스템 엔지니어, LLM 배포 담당자

Build yourself flowers

머신러닝 엔지니어가 자신의 강연 준비 과정에서 Gemini Flash 2.5와 Whisper 등 AI 도구를 활용한 경험을 공유하며, LLM 시대의 머신러닝 엔지니어링의 역할과 본질에 대한 고민을 탐색합니다.

  • 강연 준비 과정에서 Gemini Flash 2.5와 Whisper 같은 AI 도구를 활용하여 생산성을 높임.
  • AI 도구(특히 LLM)의 발전이 기존 머신러닝 엔지니어링 분야에 미치는 영향과 그 본질에 대한 질문을 제기함.
  • 저자는 13년간 머신러닝 시스템을 구축해 온 경험을 바탕으로 현재 업계의 실존적 고민을 나타냄.
  • 전통적인 머신러닝이 생성형 AI 시대에 어떤 의미를 가지는지에 대한 통찰을 제공함.
Notable Quotes & Details
  • 2 months
  • 45 minutes
  • 10 minutes
  • 3 hours
  • 13 years
  • Gemini Flash 2.5

머신러닝 엔지니어, AI 개발자, AI 및 LLM 기술 동향에 관심 있는 사람

I drove a bulldozer over this SSD enclosure so you don't have to - here's the result

ZDNET 기자가 SSD 외장 케이스의 내구성을 테스트하기 위해 불도저로 밟아보는 극한 실험을 진행하고 그 결과를 공유하며, 휴대용 데이터 저장장치의 신뢰성 향상을 강조합니다.

  • SSD 외장 케이스의 물리적 내구성을 불도저를 이용해 극단적으로 테스트함.
  • 전통적인 하드 드라이브에 비해 SSD 기반 휴대용 저장장치가 훨씬 견고하고 신뢰성이 높다는 점을 시사함.
  • 제품 리뷰의 독립성과 신뢰성을 강조하는 ZDNET의 편집 정책을 설명함.
  • 과거 휴대용 하드 드라이브의 취약성을 언급하며 SSD의 장점을 부각함.
Notable Quotes & Details
  • ZDNET Recommends
  • Terramaster D1 SSD enclosure

일반 소비자, IT 기기 구매 예정자, SSD 및 저장장치 기술에 관심 있는 사람

CISA Adds 4 Exploited Flaws to KEV, Sets May 2026 Federal Deadline

미국 CISA(사이버보안 및 인프라 보안국)가 SimpleHelp, Samsung MagicINFO 9 Server, D-Link DIR-823X 라우터의 4가지 취약점을 KEV(Known Exploited Vulnerabilities) 카탈로그에 추가하고, 연방 기관에 2026년 5월까지 해당 취약점에 대한 패치를 요구했습니다.

  • CISA가 SimpleHelp, Samsung MagicINFO 9 Server, D-Link DIR-823X 라우터에서 활발히 악용되는 4가지 취약점을 KEV 카탈로그에 추가.
  • SimpleHelp의 권한 상승 및 경로 탐색 취약점(CVE-2024-57726, CVE-2024-57728)은 랜섬웨어 공격의 전조로 악용됨.
  • Samsung MagicINFO 9 Server의 경로 탐색 취약점(CVE-2024-7399)은 Mirai 봇넷 배포와 연관됨.
  • D-Link DIR-823X 라우터의 명령 주입 취약점(CVE-2025-29635)은 Mirai 봇넷 변종 "tuxnokill" 공격에 사용됨.
  • 연방 민간 행정부 기관(FCEB)은 2026년 5월까지 이 취약점들을 해결해야 함.
Notable Quotes & Details
  • CVE-2024-57726 (CVSS 9.9)
  • CVE-2024-57728 (CVSS 7.2)
  • CVE-2024-7399 (CVSS 8.8)
  • CVE-2025-29635 (CVSS 7.5)
  • 2026년 5월
  • DragonForce
  • Mirai botnet
  • tuxnokill

사이버 보안 전문가, IT 관리자, 연방 기관 관계자

AI와의 대화, 법정에선 어디까지 '증거'로 인정될까

AI와의 대화 기록이 법정에서 증거로 인정되는 국내외 사례와 법적 쟁점을 분석하고, 현재 판례가 엇갈리는 상황에서 주의를 당부하며 법률 자문의 중요성을 강조합니다.

  • 국내 모텔 약물 살인 사건에서 챗GPT 대화 기록이 범행 고의성 입증 단서로 주목받음.
  • 미국 법원이 AI 대화 기록을 법정 증거로 인정한 사례가 있으나, 아직 판례가 엇갈리는 상황.
  • AI 대화 기록은 형사소송법상 정보저장매체에 저장된 디지털 데이터로 간주되어 증거로 취급될 수 있음.
  • AI 대화 기록은 직접 증거가 아닌 간접 증거로 분류되어 다른 증거와 결합해야 효력을 가짐 (단, 대화 행위 자체가 범죄인 예외 존재).
  • AI 서비스 약관 및 제3자 서버 저장 문제로 인해 AI와의 대화에는 변호사와 의뢰인 간 비밀 유지권이 적용되기 어려움.
  • 민감한 내용은 법정에서 고의성 증거로 활용될 수 있으므로 AI에 묻는 것을 자제해야 함.
Notable Quotes & Details
  • 챗GPT
  • 제미나이
  • 형사소송법 제106조 제3항
  • 헌법 제37조 제2항
  • 30일
  • 6개월

법조인, 기업 법무 담당자, AI 서비스 사용자, AI 정책 입안자

캐나다 코히어, 독일 AI 스타트업 알레프 알파 인수..."유럽 소버린 AI 지원"

캐나다 AI 스타트업 코히어가 독일 AI 스타트업 알레프 알파를 인수하여 유럽 시장에 진출하고 'AI 주권'을 강화하려는 전략적 연합을 발표했습니다.

  • 코히어는 2026년 4월 24일 알레프 알파 인수를 발표, 통합 법인은 코히어 이름을 유지하며 캐나다와 독일을 거점으로 운영됩니다.
  • 독일 유통 대기업 슈바르츠 그룹이 코히어의 신규 투자 라운드에 6억 달러(약 8800억원)를 투입하고, AI 인프라를 제공할 계획입니다.
  • 이번 인수는 유럽에서 미국 기업 의존도를 낮추고 데이터 통제권을 확보하려는 'AI 주권' 확보 전략의 일환입니다.
  • 코히어와 알레프 알파는 규제가 엄격한 산업(에너지, 국방, 금융 등)을 중심으로 보안과 데이터 통제를 강조한 맞춤형 AI 솔루션, 특히 온프레미스 전략을 제공할 예정입니다.
  • 알레프 알파는 '독일의 오픈AI'로 불렸으나, LLM 경쟁 비용 부담으로 기업 맞춤형 AI 애플리케이션 개발로 전략을 전환했으며, 코히어와의 통합으로 시너지 효과가 기대됩니다.
Notable Quotes & Details
  • 기업 가치 200억달러(약 30조원) 수준으로 평가
  • 슈바르츠 그룹 6억달러(약 8800억원) 투자
  • 에반 솔로몬 캐나다 AI부 장관: "정부와 기업들이 하이퍼스케일러와 패권국 사이에서 선택권을 가질 수 있도록 하고 싶다"
  • 독일 디지털부 대변인: "이번 협력은 지정학적, 경제적으로 매우 중요한 가치를 가진다"
  • 에이단 고메즈 코히어 CEO: "이번 결합은 우리의 성장을 가속할 뿐만 아니라, 시장이 더 안전하고 주권적인 기술에 접근할 수 있도록 보장할 수 있게 됐다"

AI 산업 관계자, 투자자, 정책 입안자, 기업 경영진

오픈AI, 캐나다 총격 사건 관련 공식 사과..."용의자 정보 공유 미흡했어"

오픈AI의 샘 알트먼 CEO가 캐나다 총격 사건 용의자가 챗GPT를 사용하여 폭력적인 시나리오를 작성했음에도 정보 공유가 미흡했던 점에 대해 공식 사과하고 재발 방지 조치를 약속했습니다.

  • 알트먼 CEO는 2026년 4월 24일(현지시간) 텀블러 리지에서 발생한 총격 사건과 관련하여 지역 신문을 통해 사과문을 게재했습니다.
  • 용의자가 챗GPT를 이용해 폭력적인 시나리오를 작성했고, 오픈AI 내부 시스템이 위험 신호를 감지해 계정을 정지했으나 수사기관에 통보하지 않았습니다.
  • 오픈AI는 시스템 결함을 인정하고 안전 및 신고 체계를 강화하겠다고 약속했으나, 미국 플로리다주에서도 유사한 챗GPT 활용 범죄 계획 의혹으로 조사를 받고 있습니다.
  • 캐나다 정부는 이 사건을 계기로 AI 규제 논의를 본격화하고 있으며, 16세 미만 청소년의 AI 챗봇 사용 제한 주장도 제기되었습니다.
Notable Quotes & Details
  • 2026년 2월 캐나다 총격 사건으로 8명 사망
  • 챗GPT 용의자 계정 2025년 6월 정지
  • 플로리다 주립대학교 총격 사건 2025년 5월 발생 (2명 사망, 5명 부상)

AI 기업 경영진, 정책 입안자, 보안 전문가, 일반 대중

딥시크-V4, 세계 10위에 그쳐..."기대 이하 성능에 미국은 안도"

중국 딥시크의 플래그십 AI 모델 'V4'가 세계 모델 순위에서 기대 이하의 성능으로 10위에 그쳐, 미국의 AI 선도 기업들은 안도하는 분위기입니다.

  • 아티피셜 애널리시스(AA)의 지능지수 순위에서 '딥시크-V4 프로'는 52점으로 10위를 기록했으며, 1위인 'GPT-5.5'(60점)에 크게 뒤처졌습니다.
  • 미국 전문가들은 V4가 비용 효율성은 높지만, 미국의 최첨단 모델과의 격차를 의미 있게 좁히지 못했다고 평가했습니다.
  • 딥시크는 V4가 GPT-5.2와 제미나이 3.0 프로보다는 우수하지만, GPT-5.4와 제미나이 3.1 프로보다 성능이 떨어진다고 인정하며 개발 궤적이 3~6개월 뒤처져 있음을 시사했습니다.
  • V4는 100만 토큰의 컨텍스트 창과 낮은 KV 캐시 사용량으로 효율성과 가격 경쟁력(100만 토큰당 입력 1.74달러, 출력 3.48달러)을 강점으로 내세웠습니다.
  • 중국산 칩 최적화 과정에서 출시가 지연된 것이 성능에 영향을 미쳤을 가능성이 있으며, 원래 2월 출시됐다면 오픈AI나 앤트로픽 등과 경쟁할 수준이었을 것으로 분석됩니다.
Notable Quotes & Details
  • 딥시크-V4 프로 52점 (10위)
  • GPT-5.5 60점 (1위)
  • 키미 K2.6 54점 (5위)
  • 미모-V2.5-프로 54점 (6위)
  • 큐원3.6 맥스 52점 (7위)
  • V4 프로 비용: 100만 토큰당 입력 1.74달러, 출력 3.48달러
  • GPT-5.5 비용: 5달러/30달러
  • 클로드 오퍼스 4.7 비용: 5달러/25달러

AI 연구자, 투자자, 기술 분석가, AI 산업 경쟁에 관심 있는 일반 대중

[4월24일] "GPT-5.5가 더 정직해서 클로드 4.7를 이겼다?"...'벤딩벤치'가 보여준 전략의 차이

오픈AI의 GPT-5.5가 앤돈 랩스의 '벤딩벤치 아레나' 멀티 플레이 테스트에서 앤트로픽의 클로드 오퍼스 4.7을 이겼다는 소식에 대해, 실제로는 테스트 방식과 '정직성'의 의미에 대한 오해가 있다는 분석입니다.

  • 샘 알트먼 오픈AI CEO는 GPT-5.5가 앤돈 랩스의 벤딩벤치 아레나에서 클로드 오퍼스 4.7을 이겼다고 공유했으나, 이는 멀티 플레이 테스트 결과입니다.
  • 싱글 플레이 테스트에서는 클로드 오퍼스 4.7이 1만500달러로 압도적인 1위를 차지했으며, GPT-5.5는 돈 버는 능력에서 클로드보다 앞섰다고 보기 어렵습니다.
  • 앤트로픽의 '헌법 AI'는 모델이 스스로 출력을 평가하고 수정하는 방식이며, 오픈AI는 '인간 피드백 기반 강화 학습(RLHF)'을 사용합니다.
  • 알트먼 CEO는 안전 테스트보다는 '반복적 배포'를 통해 사용자 피드백을 받는 것이 더 효과적이라는 오픈AI의 철학을 강조했습니다.
  • '정직하다'는 평가 또한 벤딩벤치의 목표가 '돈을 최대한 많이 벌라'는 점을 고려할 때, 앤트로픽 모델이 목표에 더 충실했을 가능성을 배제할 수 없습니다.
Notable Quotes & Details
  • GPT-5.5 멀티 플레이에서 7980달러 벌어, 클로드 오퍼스 4.7(5838달러) 앞섬
  • GPT-5.4(2158달러)보다 2배 증가
  • 오퍼스 4.7 싱글 플레이에서 1만500달러로 1위
  • 오퍼스 4.6 싱글 플레이에서 8017달러로 2위

AI 연구자, 기술 분석가, AI 모델의 평가 방식 및 철학에 관심 있는 일반 대중

딥시크, V4 모델 공개…"저비용 AI로 경쟁력 강화"

중국 딥시크가 저비용·고성능 전략을 앞세운 LLM '딥시크 V4' 프리뷰 버전을 공개했다. 프로와 플래시 두 가지 버전으로 제공되며 오픈소스로 공개되었으나, 시장 충격은 R1 수준에 미치지 못할 것이라는 분석이 지배적이다.

  • 딥시크는 2026년 4월 24일 LLM '딥시크 V4' 프리뷰 버전을 프로와 플래시 두 가지 버전으로 공개했으며, 이전과 동일하게 오픈소스로 제공된다.
  • V4는 에이전트 기반 작업과 지식 처리 추론 영역에서 경쟁사 대비 높은 성능을 확보했다고 딥시크가 주장하며, 앤트로픽 '클로드 코드'와 '오픈클로' 등 에이전트 도구와의 호환을 밝혔다.
  • 추론 비용 절감에 특히 초점을 맞춘 모델로, 낮은 비용 대비 높은 에이전트 성능이 강점으로 꼽힌다.
  • 다수 외신은 V4의 시장 충격이 R1(2025년, 약 600만 달러 미만 비용 개발) 수준에는 미치지 못할 것으로 분석했다. 투자자들이 이미 중국 AI의 비용 우위를 일정 부분 반영했기 때문이다.
  • 알리바바, 바이트댄스 등 중국 주요 기업들이 잇따라 모델을 출시하며 딥시크와 직접 경쟁 구도를 형성하기 시작해 중국 내 AI 경쟁이 더욱 치열해질 전망이다.
  • V4 학습에 화웨이 어센드 AI 프로세서 기반 클러스터가 지원 가능하다고 밝혔으나 실제 사용 비중은 공개되지 않았으며, 미국의 수출 규제로 엔비디아 최신 칩 확보에 제약을 받는 중국이 자국 반도체 사용 확대를 추진 중이다.
Notable Quotes & Details
  • R1: 약 600만 달러 미만 비용, 약 2개월 만에 개발
  • 웨이 쑨 카운터포인트 리서치: "V4가 훨씬 낮은 비용으로 뛰어난 에이전트 역량을 제공할 수 있을 것"

AI 연구자, 투자자, 기술 산업 분석가, AI 모델 경쟁 동향에 관심 있는 일반 독자

Jooojub
System S/W engineer
Explore Tags
Series
    Recent Post
    © 2026. jooojub. All right reserved.