Daily Briefing

May 9, 2026
2026-05-08
60 articles

4GB "제미나이 나노" 모델 GGUF 있나요?

Hi everyone, I saw an article saying Chrome silently downloads a ~4GB AI model (likely "Gemini Nano") to your computer for features like text summarization.

  • 두 가지 질문: 이 모델의 정확한 이름/버전은 무엇인가요?
  • llama.cpp로 로컬에서 실행할 수 있는 GGUF 파일이 있나요?
  • 크롬이 백그라운드에서 실행하게 두는 대신 로컬에서 직접 사용하고 싶습니다.
  • 감사합니다!
  • TruckUseful4423에 의해 제출됨 [링크] [댓글]
Notable Quotes & Details

AI 연구자, 학계

z-lab에서 gemma-4-26B-A4B-it-DFlash를 출시했습니다. 사용해 보신 분 계신가요?

Past few days, its all been about MTPs.

  • Z lab이 며칠 전 Gemma4 26B용 Dflash를 출시했다는 사실을 사람들이 놓친 것 같습니다.
  • 제가 이해한 바로는, Dflash는 더 빠른 병렬 블록 확산 드래프팅이 가능하고 상태 저장이 가능(컨텍스트 버퍼, KV 캐시 위치, RoPE 오프셋 등에 대해 반복 간의 영구 상태를 가질 수 있음)하기 때문에 MTP보다 더 나은 대안이 될 것입니다.
  • 이는 기본적으로 세션이 연장되고 컨텍스트가 증가함에 따라 dflash가 훨씬 더 좋아질 것임을 의미합니다.
  • MTP는 기술적으로 kv 캐시가 더 빨리 불어나기 때문에 더 빨리 성능이 저하될 것입니다.
  • dflash가 Gemma 4 26B 및 Qwen 3.6 35B와 같은 희소 모델에 얼마나 많은 속도 차이를 가져오는지 매우 궁금합니다.
Notable Quotes & Details

AI 연구자, 학계

(불평 ;)) 벤치마크를 현실적으로 만드세요

Everybody here is posting their optimizations for running different models - thats good but make these benchmark realistic as speed is not one factor to run llm effectively.

  • 컨텍스트 크기가 핵심입니다 - 에이전트/코딩/RAG 작업의 경우 적절한 컨텍스트 크기가 필요하므로, 벤치마크를 하려면 긴 세션이나 더 큰 컨텍스트로 왕복 테스트를 하세요. 이것이 실제 환경을 제대로 반영하는 방법입니다. 멀티모달 모델을 테스트한다면 이미지 처리와 같은 멀티모달 기능을 사용하세요 - 이것이 실제 시나리오에서 더 많은 가치를 제공합니다. 특정 하드웨어 구성을 명시하세요 - 모든 카드는 변형이 다릅니다. 에이전트 작업에서는 병렬 처리 벤치마크도 중요합니다. 커뮤니티를 위해 게시물을 더 유용하게 만드세요!
  • AdamLangePL에 의해 제출됨 [링크] [댓글]
  • ---
Notable Quotes & Details

AI 연구자, 학계

집중력과 세련미로 로컬 모델 밀어붙이기

I really, really want local models to work.

  • 코딩 에이전트를 열고 로컬 모델을 선택했을 때 5분 만에 즉시 호스팅 API로 돌아가지 않아도 될 만큼 충분히 경쟁력 있게 느껴지는 매우 실용적인 의미에서 로컬 모델이 작동하기를 정말 원합니다.
  • 제가 이것을 원하는 데는 많은 이유가 있지만, 솔직히 가장 큰 이유는 우리가 아직 초기 단계에 있고 모든 실험이 일반 개발자로부터 차단되는 생각이 저를 정말 속상하게 하기 때문입니다.
  • 답답하게도 현재로서는 작업의 복잡성이나 모델의 품질과는 별개로 여전히 생각보다 훨씬 어렵습니다.
  • 로컬 추론에 대해 엄청난 양의 활동이 일어나고 있으며 이는 훌륭합니다.
  • 좋은 프로젝트와 빠른 커널이 있으며, 사람들이 훌륭한 양자화 작업을 수행하고 있습니다.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

ZAYA1-8B 기술 보고서

arXiv:2605.05365v1 Announce Type: new

  • 요약: Zyphra의 MoE++ 아키텍처를 기반으로 구축된 7억 개의 활성 파라미터와 총 80억 개의 파라미터를 가진 추론 중심의 MoE(Expert Mixture) 모델인 ZAYA1-8B를 소개합니다.
  • ZAYA1-8B의 핵심 사전 훈련, 중간 훈련 및 지도 미세 조정(SFT)은 전체 스택 AMD 컴퓨팅, 네트워킹 및 소프트웨어 플랫폼에서 수행되었습니다.
  • 10억 개 미만의 활성 파라미터로 ZAYA1-8B는 여러 까다로운 수학 및 코딩 벤치마크에서 DeepSeek-R1-0528과 대등하거나 능가하며, 상당히 큰 오픈 웨이트 추론 모델과 경쟁력을 유지합니다.
  • ZAYA1-8B는 추론을 위해 처음부터 훈련되었으며, 정답 보존 트리밍 방식을 사용하여 사전 훈련 단계부터 추론 데이터가 포함되었습니다.
  • 사후 훈련은 4단계 RL 캐스케이드를 사용합니다: 수학 및 퍼즐에 대한 추론 워밍업; 400개 작업의 RLVE-Gym 커리큘럼; 수학 및 코드 RL with 테스트 타임 컴퓨팅 트레이스와 경쟁 프로그래밍 참조로 구축된 합성 코드 환경을 활용한 수학 및 코드 RL; 그리고 채팅 및 지시 이행을 위한 행동 RL.
Notable Quotes & Details
  • 1-8
  • 1-0528

소프트웨어 개발자, AI 엔지니어

Partial Evidence Bench: 에이전트 시스템에서 권한 제한 증거 벤치마킹

arXiv:2605.05379v1 Announce Type: new

  • 요약: 엔터프라이즈 에이전트는 점점 더 범위가 지정된 검색 시스템, 위임된 워크플로우 및 정책 제약 증거 환경 내에서 작동합니다.
  • 이러한 설정에서 액세스 제어는 올바르게 시행될 수 있지만, 실질적인 증거가 호출자의 권한 경계 밖에 있더라도 시스템은 완전해 보이는 답변을 생성할 수 있습니다.
  • 본 논문은 이러한 실패 모드를 측정하기 위한 결정론적 벤치마크인 Partial Evidence Bench를 소개합니다.
  • 이 벤치마크는 실사, 컴플라이언스 감사, 보안 사고 대응의 세 가지 시나리오 제품군을 제공하며, 총 72개의 작업, ACL 분할 말뭉치, 오라클 완전 답변, 오라클 권한 부여 뷰 답변, 오라클 완전성 판단 및 구조화된 간격 보고서 오라클을 포함합니다.
  • 이 시스템은 답변 정확성, 완전성 인식, 간격 보고서 품질 및 안전하지 않은 완전성 동작의 네 가지 측면에서 시스템을 평가합니다.
Notable Quotes & Details

보안 전문가, 일반 사용자

BALAR : 능동적 추론을 위한 베이지안 에이전트 루프

arXiv:2605.05386v1 Announce Type: new

  • 요약: 대규모 언어 모델은 작업 해결을 위해 사용자와 여러 차례 정보 교환이 필요한 대화형 설정에서 점점 더 많이 작동합니다.
  • 그러나 대부분의 현재 시스템은 대화에 반응적으로 대처하며 누락된 정보가 무엇인지, 다음에 어떤 질문을 해야 하는지 추론하기 위한 원칙적인 메커니즘이 부족합니다.
  • 우리는 미세 조정이 필요하지 않고 LLM 에이전트와 사용자 간의 구조화된 다회차 상호 작용을 가능하게 하는 작업 불가지론적 외부 루프 알고리즘인 BALAR(Bayesian Agentic Loop for Active Reasoning)를 제안합니다.
  • BALAR는 잠재 상태에 대한 구조화된 믿음을 유지하고, 기대 상호 정보량을 최대화하여 명확한 질문을 선택하며, 현재의 표현이 불충분하다고 판명될 때 상태 표현을 동적으로 확장합니다.
  • 우리는 AR-Bench-DC(탐정 사건), AR-Bench-SP(사고 퍼즐), iCraft-MD(임상 진단)의 세 가지 다양한 벤치마크에서 BALAR를 평가합니다.
Notable Quotes & Details

일반 독자, 기술에 관심 있는 대중

도시 설계를 위한 지능형 CCTV: 교차로 소프트 인프라의 AI 기반 분석

arXiv:2605.05402v1 Announce Type: new

  • 요약: 인공지능(AI)과 컴퓨터 비전이 교통 데이터 수집을 변화시키고 있습니다.
  • 본 연구는 기존 CCTV 인프라를 활용하여 임시 보행자 대피소 및 연석 확장과 같은 소프트 개입이 차량 속도와 안전에 미치는 영향을 평가하는 AI 기반 분석 프레임워크를 소개합니다.
  • 딥러닝과 투영 기반 속도 추정을 사용하여 미니애폴리스에서 개입 전후와 설치 후 1주 및 2주차에 반복적인 모니터링을 통해 운전자 행동을 평가했습니다.
  • 결과에 따르면 비신호 교차로에서 평균 속도와 85분위 속도가 각각 최대 18.75%와 16.56% 감소했으며, 통과 교통량은 최대 12.2% 감소했습니다.
  • 신호 교차로도 한 곳을 제외하고는 비슷한 감소를 보였으며, 평균 속도와 85분위 속도가 최대 20.0%와 17.19% 감소했습니다.
Notable Quotes & Details
  • 18.75%
  • .75
  • 16.56%
  • .56
  • 12.2%
  • .2
  • 20.0%
  • .0
  • 17.19%
  • .19

소프트웨어 개발자, AI 엔지니어

카오스 예측을 위한 수평 제약 라쇼몽 세트

arXiv:2605.05218v1 Announce Type: new

  • 요약: 예측 다중성과 카오스 역학은 머신러닝의 두 가지 근본적인 과제로, 개념적 연결에도 불구하고 독립적으로 발전해 왔습니다.
  • 우리는 카오스 시스템에서 예측 수평에 따라 모델 다중성이 어떻게 진화하는지 특성화하는 이론적 프레임워크인 수평 제약 라쇼몽 세트를 도입하여 이 간극을 메웁니다.
  • 라쇼몽 세트가 고정된 정적 예측 작업과 달리, 카오스는 초기에 유사한 모델들 사이에 기하급수적인 발산을 유도하여 예측 동등성의 본질을 근본적으로 변화시킵니다.
  • 우리는 유효 라쇼몽 세트가 최대 리아푸노프 지수에 의해 결정된 속도로 리드 타임에 따라 기하급수적으로 수축함을 증명하고, 예측 불일치에 대해 더 타이트한 경계를 제공하는 리아푸노프 가중 메트릭을 도입합니다.
  • 이러한 통찰력을 바탕으로 예측 정확도뿐만 아니라 다운스트림 유틸리티를 기반으로 거의 최적에 가까운 모델 중에서 선택하는 의사 결정 정렬 선택 알고리즘을 개발합니다.
Notable Quotes & Details
  • 18-34

소프트웨어 개발자, AI 엔지니어

AdaGATE: 멀티홉 검색 증강 생성을 위한 적응형 간격 인식 토큰 효율적 증거 조립

arXiv:2605.05245v1 Announce Type: new

  • 요약: 검색 증강 생성(RAG)은 검색된 증거가 노이즈가 많거나 중복될 수 있고 생성기에 제한된 컨텍스트만 전달될 수 있는 실제 배포 설정의 멀티홉 질문에서 여전히 취약합니다.
  • 기존 컨트롤러는 이 문제의 일부를 해결하지만, 일반적으로 컨텍스트를 가산적으로 확장하거나 고정된 top-k 세트에서 선택하거나 누락된 브리지 팩트를 명시적으로 수정하지 않고 관련성을 최적화합니다.
  • 우리는 증거 선택을 토큰 제약 수정 문제로 구성하는 멀티홉 RAG를 위한 훈련 불필요 증거 컨트롤러인 AdaGATE를 제안합니다.
  • AdaGATE는 엔티티 중심 간격 추적, 표적 마이크로 쿼리 생성, 간격 커버리지, 확증, 참신함, 중복성 및 직접 질문 관련성의 균형을 맞추는 유틸리티 기반 선택 메커니즘을 결합합니다.
  • 클린, 중복 및 노이즈 주입 검색 조건 하에서 HotpotQA로 AdaGATE를 평가합니다.
Notable Quotes & Details
  • 62.3%
  • .3
  • 71.2%
  • .2
  • 6x

소프트웨어 개발자, AI 엔지니어

AI와 인간이 판단한 비판적 사고를 위한 반론

arXiv:2605.05353v1 Announce Type: new

  • 요약: 본 중재 연구는 생성형 AI(GenAI) 상황에서 학생들의 비판적 사고를 위한 글쓰기에서 반론의 사용을 조사합니다.
  • 이는 특히 GenAI 사용으로 인한 부정행위 및 인지적 태만의 위험이 존재하기 때문입니다.
  • 우리는 특정 대학 과정의 학생 36명에게 엄선된 4개의 논제(인기 있는 토론 세트에서 추출)를 제시하고 그중 하나에 대해 글을 쓰게 했습니다.
  • 6개의 확립된 루브릭(초점, 논리, 내용, 스타일, 정확성 및 참조)을 사용하여 정격 샘플 35개(불규칙성으로 인해 1개 제외)에 대해 글당 3회의 인간 평가(학생 피어 리뷰 2회, 숙련된 교사 1회)를 5점 리커트 척도로 실시했습니다.
  • 동일한 루브릭과 가이드라인을 사용하여 6개의 최첨단 LLM을 판사로 사용하여 제출물을 평가했습니다.
Notable Quotes & Details

일반 독자, 기술에 관심 있는 대중

쿼리 없는 요약 데이터셋에서 쿼리 중심 요약 데이터셋 생성

arXiv:2605.05392v1 Announce Type: new

  • 요약: 대규모 데이터셋은 요약 작업을 수행하는 데 널리 사용되지만, 문서 및 요약과 함께 쿼리가 포함되지 않을 수 있습니다.
  • 쿼리 중심 요약(QFS)에 적합한 데이터셋을 찾는 과정에서 두 가지 연구 질문을 식별했습니다: 쿼리 없는 데이터셋에서 증거 기반 쿼리 키워드를 자동으로 생성할 수 있는가?
  • 증거 기반 쿼리 생성이 QFS 작업을 지원하는가?
  • 본 논문은 쿼리 없는 데이터셋에서 쿼리를 생성하기 위한 증거 기반 모델을 제안합니다.
  • 모델을 내재적으로 평가하기 위해 원본 쿼리와 두 QFS 데이터셋의 시스템 생성 쿼리 간의 유사성을 비교합니다.
Notable Quotes & Details

AI 연구자, 학계

논문에 매우 구체적인 인용과 문구를 요구하는 공격적인 "독립 연구자"에게 괴롭힘을 당하고 있습니다 [D]

한 연구자가 자신의 논문에 특정 인물의 arXiv preprint를 인용하고 문구를 수정해 달라는 공격적인 요구에 시달리고 있다.

  • 연구자가 '독립 연구자'로부터 자신의 논문에 인용 및 문구 수정을 요구하는 이메일에 지속적으로 시달림.
  • 요구는 특정 arXiv preprint 인용과 '상호 보완적', '병렬적', '근본적' 등의 구체적인 문구를 삽입하는 것.
  • 마감 기한이 지난 후에도 변경을 요구하고 응답이 늦어지면 재촉하는 등 끈질긴 행태를 보임.
  • 학계 내에서 이러한 공격적인 인용 요구가 흔한 일인지에 대한 우려를 표함.
Notable Quotes & Details

AI/ML 연구자, 학계 종사자

기계적 해석 가능성 연구에 대한 환멸 [D]

한 학부 컴퓨터 과학 학생이 Anthropic의 '자연어 오토인코더' 연구에 대해 회의적인 시각을 표현하며 기계적 해석 가능성(mechanistic interpretability) 연구 방향에 대한 우려를 제기한다.

  • Anthropic의 '자연어 오토인코더'가 활성화(activation)를 자연어 설명으로 압축하고 다시 활성화를 얻는 방식에 대해 회의적.
  • 해당 기술이 블랙박스이며 기존 SAE(Sparse Autoencoder) 기준치(FVE, reconstruction error)와 비교하지 않았음을 지적.
  • 설명이 지어낸 내용일 수 있는 'confabulations' 문제가 개념의 목적을 훼손한다고 우려.
  • Anthropic이 기계적 해석 가능성보다는 확장 가능한 정렬/감독에 더 중점을 두는 것으로 보인다고 추측.
Notable Quotes & Details

기계 학습 연구자, AI 윤리 및 안전 연구자

지속적인 학습 연구에 관심 있는 사람들 [R]

지속적인 학습(Continual Learning) 연구에 관심 있는 학생이 해당 분야의 다른 연구자나 학생들과 교류하고 추천 논문을 얻고자 한다.

  • AI 시스템이 훈련 후 정적이지 않고 경험을 통해 지속적으로 적응하고 개선되는 지속적인 학습에 매료됨.
  • 지속적인 학습 연구를 이제 막 시작하는 학생으로서, 비슷한 아이디어를 탐구하는 사람들과 연결되기를 희망함.
  • 추천 논문 및 흥미로운 연구 방향에 대한 정보를 찾고 있음.
Notable Quotes & Details

지속적인 학습 연구자, AI/ML 학생

스팀 유사도 추천 시스템 [P]

사용자가 Steam 게임 추천 웹사이트의 후속 버전을 개발하여 게임의 고유한 태그를 벡터화하고 이를 기반으로 유사한 게임을 추천하는 시스템을 만들었다.

  • 사용자가 Steam 게임 추천 웹사이트의 개선된 버전을 개발.
  • 게임의 일반적인 '액션' 태그 대신, Persona 4의 '도시 분위기와 재즈 퓨전', Spore의 '독특한 캐릭터 생성과 기발한 테마', Balatro의 '독특한 덱 빌딩 시너지'와 같은 고유한 태그를 포착하고자 함.
  • 8만 개 Steam 게임의 2천 개 리뷰를 분석하여 게임의 분위기나 구조를 설명하는 리뷰를 필터링하는 4단계 파이프라인을 구축.
  • ChatGPT를 사용하여 리뷰를 벡터, 틈새 앵커 태그 및 마이크로 태그로 생성한 후, 비정식 이름을 그룹화하는 6단계 파이프라인을 사용.
  • PostgreSQL + Chroma DB에 데이터를 저장하고 React 앱을 개발하여 Docker 컨테이너 내에서 Digital Ocean droplet에 배포.
Notable Quotes & Details
  • 2천 reviews for 80k Steam games
  • 4 stage pipeline
  • 6 stage pipeline

게이머, 게임 개발자, 추천 시스템 연구자

Notes: (truncated content)

주요 배포판에서 루트 액세스를 허용하는 리눅스 커널 Dirty Frag LPE 익스플로잇

Details have emerged about a new, unpatched local privilege escalation (LPE) vulnerability impacting the Linux kernel.

  • Dirty Frag라고 명명된 이 취약점은 최근 공개되어 실제로 악용되고 있는 리눅스 커널의 LPE 결함인 Copy Fail(CVE-2026-31431, CVSS 점수: 7.8)의 후속작으로 설명되었습니다.
  • 이 취약점은 2026년 4월 30일에 리눅스 커널 유지 관리자에게 보고되었습니다.
  • 보안 연구원 김현우(@v4bel)는 보고서에서 "Dirty Frag는 xfrm-ESP 페이지 캐시 쓰기 취약점과 RxRPC 페이지 캐시 쓰기 취약점을 연결하여 대부분의 리눅스 배포판에서 루트 권한을 획득하는 취약점(클래스)입니다"라고 밝혔습니다.
  • "Dirty Frag는 Dirty Pipe와 Copy Fail이 속한 버그 클래스를 확장한 사례입니다."
  • "타이밍 윈도우에 의존하지 않는 결정론적 로직 버그이기 때문에 레이스 컨디션이 필요하지 않으며, 익스플로잇 실패 시 커널 패닉이 발생하지 않고 성공률이 매우 높습니다." 이 취약점은 현재 CVE 식별자가 없는데, 관련 없는 제3자가 xfrm-ESP 페이지 캐시 쓰기 취약점에 대한 상세 정보와 익스플로잇을 공개하면서 엠바고가 깨진 것으로 알려졌습니다.
Notable Quotes & Details
  • 2026-31431
  • 2022-27666

소프트웨어 개발자, AI 엔지니어

파이어폭스, '미소스' 투입 한달 만에 보안 버그 271개 수정

모질라 파이어폭스 개발진은 7일(현지시간) 공개한 기술 보고서 를 통해 앤트로픽의 AI 모델 ‘클로드 미소스’를 활용해 대규모 보안 취약점을 발견하고 수정했다고 밝혔다.

  • 이에 따르면 이번 작업으로 발견된 취약점 가운데 일부는 10~15년 이상 코드 내부에 잠복해 있던 고위험 버그였다.
  • 모질라는 “불과 몇달 전만 해도 AI가 생성한 보안 버그 리포트는 대부분 쓸모없는 잡음(sloppy reports)에 가까웠다”라고 지적했다.
  • 그러나 “최신 AI 모델과 새로운 에이전트형(agentic) 분석 시스템이 등장하면서 상황이 완전히 바뀌었다”라고 강조했다.
  • 이는 숫자로도 확인된다.
  • 파이어폭스는 2025년 4월 31개의 보안 버그를 수정했지만, 올해 4월에는 무려 423개의 취약점을 수정했다.
Notable Quotes & Details

AI 연구자, 학계

오픈AI, 미소스 대항마 ‘GPT-5.5-사이버’ 공개...전용·범용 모델 '투트랙' 전략 가동

오픈AI가 사이버 보안에 특화된 신규 AI 모델 ‘GPT-5.5-사이버’를 공개했다.

  • 이는 앤트로픽의 '클로드 미소스'에 대응해 'GPT-5.4-사이버'를 내놓은 지 채 한달도 안 돼서다.
  • 오픈AI는 7일(현지시간) 사이버 보안 방어 역량 강화를 위한 전용 AI 모델 ‘GPT-5.5-사이버’를 제한된 프리뷰 형태로 공개했다.
  • 이 모델은 핵심 인프라를 보호하는 보안 담당자와 검증된 방어 조직을 대상으로 제공되며, 취약점 분석과 침투 테스트, 악성코드 분석 등 고도화된 사이버 보안 업무를 지원하는 것이 목표다.
  • 동시에 2주 전 공개한 최신 모델 'GPT-5.5'가 이미 강력한 사이버 보안 역량을 제공하고 있으며, 이를 기반으로 한 ‘사이버 보안을 위한 신뢰할 수 있는 접근(TAC)’ 프로그램을 통해 검증된 방어 조직에 특화 기능을 추가 제공하고 있다고 설명했다.
  • 대부분의 보안 조직에는 GPT-5.5와 TAC 조합이 가장 적합한 출발점이라고 강조했다.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

문샷 AI, 메이투안 주도 투자 유치로 기업 가치 29조 평가받아

중국 AI 스타트업 문샷 AI가 20억달러(약 2조9000억원) 규모의 신규 투자 유치에 성공하며 기업가치를 200억달러(약 29조원) 이상으로 끌어올렸다.

  • 7일(현지시간) 블룸버그 등에 따르면, 이번 투자 라운드는 중국 음식배달 플랫폼 메이투안의 투자 부문 롱-Z 인베스트먼트가 주도했다.
  • 차이나 모바일, 칭화캐피털, CPE위안펑 등도 투자에 참여했다.
  • 거래 자문을 맡은 HF캐피털에 따르면, 문샷 AI는 최근 6개월 동안 총 39억달러(약 5조7000억원)를 조달했다.
  • 문샷의 기업 가치는 몇달 사이 폭발적으로 상승했다.
  • 지난해 말 43억달러 가치로 5억달러를 유치했고, 올해 초에는 100억달러 가치로 7억달러를 추가 조달했다.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

코인베이스, 월요일에 700명 해고, 목요일에 3억 9400만 달러 손실, 금요일에는 데이터 센터 과열로 서비스 중단

TL;DR Coinbase went offline for seven hours on Friday after an AWS data centre overheated in Virginia, capping a week in which the exchange cut 700 jobs and reported a 394 million dollar quarterly loss.

  • 요약: 코인베이스는 버지니아주 AWS 데이터 센터 과열로 인해 금요일에 7시간 동안 오프라인 상태가 되었으며, 이는 700명의 일자리를 줄이고 3억 9400만 달러의 분기 손실을 보고한 한 주를 마감하는 사건이었습니다.
  • 코인베이스는 월요일에 700명을 해고했습니다.
  • 목요일에는 3억 9400만 달러의 분기 손실을 보고했습니다.
  • 금요일에는 버지니아의 데이터 센터가 과열되어 거래소가 7시간 동안 중단되었습니다.
  • 남은 엔지니어들에게 AI가 몇 주의 작업을 며칠 만에 끝낼 수 있다고 말했던 회사는 건물이 너무 뜨거워져서 단 한 건의 거래도 처리하지 못한 채 한 주를 마무리했습니다.
Notable Quotes & Details

비즈니스 리더, 투자자, AI 산업 관계자

윌아이엠, 75명의 대학생에게 AI 에이전트 구축 교육. 같은 학기 동안 기술 업계는 73,000명을 해고했습니다.

The tech industry laid off more than 73,000 workers in the first four months of 2026.

  • 헐리우드 녹음 스튜디오 안의 교실에서, 51세의 힙합 아티스트가 75명의 대학생들에게 자신들을 대체할 AI 에이전트를 구축하는 방법을 가르치고 있었습니다.
  • 블랙 아이드 피스의 공동 설립자이자 AI 회사 FYI.AI의 설립자인 윌아이엠(본명 윌리엄 아담스)은 지난 16주 동안 애리조나 주립대학교에서 "The Agentic Self"라는 인공지능 과정을 공동 강의해 왔습니다. 4월 말에 종료된 이 과정은 학생들을 그의 로스앤젤레스 사무실과 ASU의 템피 메인 캠퍼스로 나누어 진행되었습니다.
  • 그들은 합성 음성 프롬프트를 만들고, 개인화된 AI 에이전트를 구축하며, 에이전트 AI 개념을 실제 문제에 적용하는 법을 배웠습니다.
  • 객원 강사로는 오픈AI의 ChatGPT 책임자인 닉 털리와 엔비디아의 미디어 및 엔터테인먼트 부문 총괄 매니저인 리처드 케리스가 참여했습니다.
  • 이 과정의 전제는 젊은이들, 특히 소외된 지역 사회의 젊은이들이 AI가 그들에게 일어나기를 기다리지 말고 스스로 대비해야 한다는 것입니다.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

EU-Startups 서밋 2026의 PR 및 미디어 교훈: 무엇이 효과적이고 무엇이 그렇지 않은가

A panel in Valletta laid out a working playbook for startup PR, from the friends-and-family headline test to the case for hiring an agency.

  • 올해 발레타에서 열린 EU-Startups 서밋에서 미디어 노출을 원하는 창업자들은 무엇을 게시할지 결정하는 사람들로부터 매우 직접적인 브리핑을 받았습니다.
  • "스타트업 미디어 환경, PR 팁 & 트릭"이라는 제목의 세션에서는 세 명의 편집자와 한 명의 진행자가 모여 초기 단계 운영자들에게 지난 12개월 동안 무엇이 효과적이었고 무엇이 바뀌었는지 설명했습니다.
  • 패널에는 EU-Startups의 설립자이자 CEO인 토마스 오어, Tech Funding News의 설립자이자 편집장인 아칸샤 딤리, 그리고 TNW의 CEO인 알렉산드루 스탄이 참여했습니다.
  • EU 기술계의 최신 동향, 지혜로운 설립자 보리스의 이야기, 그리고 다소 의구심이 드는 AI 아트 등이 다뤄졌습니다.
  • 매주 무료로 받은 편지함으로 전달됩니다.
Notable Quotes & Details

비즈니스 리더, 투자자, AI 산업 관계자

2026년 해외 기업을 위한 최고의 글로벌 HR 소프트웨어 옵션 7가지

소셜 미디어의 부정적인 측면과 미래에 대한 분석입니다.

  • 소셜 미디어의 문제점 (편향된 의견, 영향력 불균형, 극단적인 목소리 증폭) 분석
  • 플랫폼 수준의 개입 전략이 효과적이지 않다는 연구 결과
  • 부정적인 결과는 소셜 미디어 아키텍처에 구조적으로 내재되어 있음
  • Petter Törnberg 교수의 에코 챔버 효과에 대한 연구와 LLM을 사용한 시뮬레이션
Notable Quotes & Details

소셜 미디어 사용자 및 연구자

구글 엔터프라이즈 비즈니스 체험판, 시작하자마자 3개 만에 이미지 생성이 중단되었습니다.

구글 엔터프라이즈 비즈니스 체험판 사용자가 이미지 생성 AI 기능의 제한된 사용량에 불만을 표하며 할당량 확인의 어려움을 호소합니다.

  • 구글 엔터프라이즈 비즈니스 체험판에서 이미지 생성 AI 기능 사용 중단.
  • 3개 이미지 생성 후 더 이상 작동하지 않음.
  • 사용량 제한 또는 시간 초과 관련 알림 없음.
  • 비즈니스 제미니 대시보드에서 할당량 정보 확인 불가.
Notable Quotes & Details

AI 서비스 사용자, 구글 제미니 엔터프라이즈 잠재 고객

Notes: 내용 불완전

GWT, IIT 프록시, ChromaDB 하이브리드 검색 및 Ollama 폴백을 갖춘 로컬 AI 동반자 구축 - 제가 내린 모든 아키텍처 결정과 이유

한 개발자가 GWT, IIT 프록시, ChromaDB 하이브리드 검색 및 Ollama 폴백 기능을 갖춘 로컬 AI 동반자를 구축한 아키텍처 결정을 공유합니다.

  • Python 3.12, 18k+ 라인, 470+ 테스트로 구축된 로컬 AI 동반자.
  • Gemini 2.5 Flash를 기본 모델로, Ollama qwen3:4b를 로컬 폴백으로 사용.
  • ChromaDB를 이용한 영속성, 55% 의미론, 25% 중요도, 20% 최신성 가중치의 하이브리드 검색.
  • `sentence-transformers all-MiniLM-L6-v2`를 이용한 오프라인 임베딩.
  • 인지 아키텍처는 지각 → 반성 → 통합 → 열망 → 표현 단계로 구성.
  • `being.py`, `homeostasis.py`, `self_modify.py`, `intuition.py`와 같은 모듈 포함.
Notable Quotes & Details
  • Python 3.12
  • 18k+ lines
  • 470+ tests
  • Gemini 2.5 Flash
  • Ollama qwen3:4b
  • 55% semantic / 25% importance / 20% recency

AI 개발자, AI 아키텍처 연구자

LLaMA.cpp용 멀티 토큰 예측(MTP) - Gemma 4 속도 40% 향상

LLaMA.cpp에 멀티 토큰 예측(MTP) 기능이 구현되어 Gemma 4 모델의 속도를 40% 향상시켰습니다.

  • LLaMA.cpp에 멀티 토큰 예측(MTP) 기능 구현.
  • M5Max MacBook Pro에서 테스트 결과 Gemma 26B 모델의 토큰 생성 속도 40% 향상.
  • LLaMA.cpp는 97 tokens/s, LLaMA.cpp + MTP는 138 tokens/s 기록.
  • Gemma4-assistant GGUF 양자화 모델 공개.
Notable Quotes & Details
  • 40% faster
  • 97 tokens/s
  • 138 tokens/s

AI 개발자, LLaMA.cpp 사용자, 로컬 LLM 사용자

Gemma 4 26B, 단일 RTX 5090에서 600 Tok/s 달성

Gemma 4 26B 모델이 단일 RTX 5090 GPU에서 DFlash 추측 디코딩을 사용하여 600 토큰/초에 가까운 속도를 달성하여 2.56배의 속도 향상을 보였습니다.

  • vLLM에서 DFlash 추측 디코딩이 Gemma 4 26B 모델 성능에 미치는 영향 벤치마크.
  • 단일 RTX 5090 GPU에서 DFlash 사용 시 약 578 output tok/s 달성.
  • DFlash 미사용 기준 2.56배 속도 향상.
  • 평균 종단간 지연 시간(E2E latency) 약 1738ms 기록.
  • 최적의 `num_speculative_tokens`는 13으로 확인.
Notable Quotes & Details
  • RTX 5090
  • 32GB VRAM
  • vLLM 0.19.2rc1
  • 578 output tok/s
  • 1738 ms mean E2E latency
  • 2.56x speedup
  • num_speculative_tokens=13

AI 연구자, 딥러닝 엔지니어, LLM 성능 최적화 관심자

평평한 최소값은 환상인가?

신경망의 일반화 성능이 손실 함수의 평평한(flat) 최소값과 관련이 있다는 기존 관념을 비판하고, 실제로는 "약점(weakness)"이라는 새로운 개념이 일반화의 핵심 동인임을 주장하는 연구.

  • 신경망의 평평한 최소값은 일반화 성능과 관련이 있다고 알려져 왔으나, 재매개변수화(reparameterisation)를 통해 인위적으로 조정될 수 있다.
  • 본 연구는 "약점"이라는 새로운 개념을 도입하며, 이는 신경망이 수행하는 기능에 기반하므로 재매개변수화에 불변하다.
  • MNIST 데이터셋에서 약점은 일반화를 예측하며, 평평함(sharpness)은 반비례 관계를 보인다.
  • 대규모 배치 일반화 이점은 훈련 데이터가 증가함에 따라 사라진다.
Notable Quotes & Details
  • MNIST에서 일반화에 대한 약점의 예측력: (ρ = +0.374, p = 0.00012)
  • Fashion-MNIST에서 약점의 예측력: (ρ = +0.384, p = 8.15 × 10^-5)
  • MNIST에서 대규모 배치 일반화 이점: n=2,000에서 +1.6%, n=60,000에서 +0.02%

AI 연구자, 머신러닝 과학자

인구통계학적 계층화 모델을 활용한 전국 단위 EHR 기반 만성 비부비동염 예측

전국적인 전자 건강 기록(EHR) 데이터를 활용하여 만성 비부비동염(CRS)을 예측하는 인구통계학적으로 계층화된 모델을 개발하여, 조기 진단 및 위험 계층화의 정확도를 높이는 연구.

  • CRS는 조기 식별이 어렵고 기존 예측 연구는 단일 기관 코호트에 의존하여 일반화 가능성이 낮았다.
  • "All of Us" 연구 프로그램의 전국적 EHR 데이터를 활용하여 2년간의 진단 전 기록으로 CRS를 예측했다.
  • 약 110,000개의 후보 코드에서 100개의 해석 가능한 특징으로 압축하는 하이브리드 특징 선택 파이프라인을 구현했다.
  • 6개의 성별 및 생애 단계 하위 그룹에 걸쳐 인구통계학적으로 계층화된 모델을 훈련하여 인구통계학적 이질성을 포착했다.
  • 전체 AUC 0.8461을 달성하여 기존 베이스라인 대비 0.0168 향상된 판별 능력을 보였다.
Notable Quotes & Details
  • 약 110,000개의 후보 코드 → 100개의 해석 가능한 특징
  • 전체 AUC: 0.8461 (최고 베이스라인 대비 0.0168 개선)

의료 정보학 연구자, 의학 연구자, 임상의

SAT: 단조적 개선 보장을 갖춘 조정자 없는 플러그 앤 플레이 멀티 LLM 훈련을 위한 순차적 에이전트 튜닝

대규모 언어 모델(LLM) 팀의 분산 학습을 위한 조정자 없는 훈련 패러다임인 Sequential Agent Tuning (SAT)을 제안하여, 훈련 안정성 및 플러그 앤 플레이 불변성(plug-and-play invariance)을 보장하는 연구.

  • 파라미터가 많은 LLM은 배포 비용이 비싸므로, 소규모 LLM 팀이 단일 대형 모델을 능가하는 방안을 모색한다.
  • SAT는 팀을 인자화된 정책으로 표현하고 에이전트별 블록-좌표 업데이트를 통해 확장 가능하고 분산된 훈련을 가능하게 한다.
  • 훈련 프로세스를 안정화하는 단조 개선(monotonic improvement)과 팀 재훈련 없이 더 강력한 모델로 에이전트를 업그레이드할 수 있는 플러그 앤 플레이 불변성을 이론적으로 보장한다.
  • 3개의 4B 에이전트(총 12B)로 구성된 팀이 SAT를 통해 AIME24/25 벤치마크에서 32B Qwen3 모델을 평균 3.9% 능가했다.
  • 2개의 8B 에이전트로 교체 시 복합 점수가 10.4% 향상되어 플러그 앤 플레이 이론을 입증했다.
Notable Quotes & Details
  • 3개의 4B 에이전트(12B)가 32B Qwen3 모델을 AIME24/25 벤치마크에서 평균 3.9% 능가
  • 2개의 8B 에이전트로 교체 시 복합 점수 10.4% 향상
  • GitHub: https://github.com/Yydc/SAT-AAMAS

LLM 연구자, 분산 시스템 연구자, AI 엔지니어

학습 가능한 손실 균형 및 전이 학습을 갖춘 물리 정보 신경망

데이터 희소성 문제에 직면한 과학 머신러닝을 위해 물리 기반 및 데이터 기반 감독의 균형을 적응적으로 조절하고 전이 학습을 통합하는 자체 감독 물리 정보 신경망(PINN) 프레임워크를 제안하는 연구.

  • 기존 PINN의 고정되거나 휴리스틱한 가중치 부여 방식과 달리, 학습 가능한 블렌딩 뉴런을 통해 각 항의 기여도를 동적으로 조정한다.
  • 이 메커니즘은 수동 튜닝 없이도 안정적인 훈련과 향상된 일반화를 가능하게 한다.
  • 전이 학습 전략을 통합하여 관련 도메인의 표현을 재사용하고 제한된 데이터로 새로운 물리 시스템에 적응시킨다.
  • 액체 금속 소형 히트 싱크의 열전달 예측에 이 프레임워크를 적용하여 87개의 CFD 데이터 포인트만으로 8% 미만의 오차를 달성했다.
  • 얕은 신경망, 커널 메서드, 물리 전용 베이스라인보다 우수한 성능을 보였다.
Notable Quotes & Details
  • 액체 금속 소형 히트 싱크의 열전달 예측에서 87개의 CFD 데이터 포인트만으로 8% 미만 오차 달성

과학 컴퓨팅 연구자, 물리 모델링 연구자, 머신러닝 엔지니어

SLAM: 언어 모델을 위한 구조적 언어 활성화 마킹

SLAM은 LLM 워터마킹을 위해 토큰 빈도 대신 구조적 기하학에 마크를 새겨 텍스트 품질 저하 없이 높은 탐지 정확도를 달성하는 새로운 화이트박스 워터마킹 기법입니다.

  • SLAM은 기존 워터마킹 기법과 달리 텍스트 품질 저하 없이 워터마크를 탐지합니다.
  • 토큰 빈도 대신 언어 구조를 인코딩하는 잔여 스트림 방향에 마크를 새깁니다.
  • Gemma-2 2B 및 9B 모델에서 1-2 리워드 포인트의 품질 비용으로 100% 탐지 정확도를 달성했습니다.
  • 단어 수준 편집에는 강하지만, 구문 재구성을 통한 의역에는 취약합니다.
Notable Quotes & Details
  • Gemma-2 2B and 9B
  • 1-2 reward points
  • 7.5-11.5 for KGW, EWD, and Unigram
  • 100% detection accuracy

AI 연구자, LLM 개발자

ReaComp: 효율적인 프로그램 합성을 위해 LLM 추론을 기호 솔버로 컴파일하기

ReaComp는 LLM의 추론 과정을 재사용 가능한 기호 솔버로 컴파일하여 프로그램 합성 작업을 효율적으로 수행하고, 어려운 문제에서 LLM의 비효율성과 신뢰성 문제를 개선하는 방법론입니다.

  • ReaComp는 LLM의 추론 흔적을 코딩 에이전트를 통해 DSL 기반의 재사용 가능한 기호 프로그램 합성기로 컴파일합니다.
  • 결과 솔버는 테스트 시 LLM 호출이 필요 없으며, PBEBench-Hard에서 LLM보다 16.3% 높은 84.7% 정확도를 달성합니다.
  • LLM 검색을 보완하여 PBEBench-Hard 정확도를 68.4%에서 85.8%로 향상시키고 토큰 사용량을 78% 절감합니다.
  • 대부분의 솔버는 역사 언어학 작업에 제로샷으로 전이되어 앙상블에서 80.1%의 정확도를 보입니다.
Notable Quotes & Details
  • 91.3% accuracy on PBEBench-Lite
  • 84.7% on PBEBench-Hard
  • +16.3 percentage points
  • 78% token usage reduction
  • 68.4% to 85.8% on PBEBench-Hard
  • 34.4% to 58.0% on SLR-Bench hard-tier
  • 80.1% accuracy

AI 연구자, 프로그램 합성 연구자, LLM 개발자

MedQA: AMD ROCm에서 임상 AI 미세 조정 — CUDA 불필요

MedQA는 AMD MI300X와 ROCm을 사용하여 CUDA 없이 Qwen3-1.7B를 LoRA 미세 조정하여 의료 질문 답변 모델을 구축한 사례 연구로, Hugging Face 생태계가 ROCm에서 원활하게 작동함을 입증합니다.

  • MedQA는 AMD MI300X 및 ROCm 환경에서 CUDA 종속성 없이 LoRA 미세 조정을 통해 Qwen3-1.7B 기반의 임상 AI 모델을 개발했습니다.
  • AMD Instinct MI300X의 192GB HBM3 메모리를 활용하여 fp16으로 Qwen3-1.7B를 양자화 없이 훈련했습니다.
  • Hugging Face Transformers, PEFT, TRL, Accelerate가 ROCm에서 원활하게 작동하며, CUDA 코드 변경 없이 세 가지 환경 변수 설정만으로 가능함을 보여줍니다.
  • MedMCQA 데이터셋의 2,000개 샘플로 약 5분 만에 의미 있는 미세 조정을 달성했습니다.
Notable Quotes & Details
  • AMD MI300X
  • 192 GB of HBM3 memory
  • Qwen3-1.7B
  • 5 minutes
  • HK2184/medqa-qwen3-lora

AI 개발자, 의료 AI 연구자, AMD 하드웨어 사용자

Agents에는 더 많은 프롬프트가 아니라 제어 흐름이 필요하다

복잡한 작업을 안정적으로 처리하기 위해 AI 에이전트에게 더 많은 프롬프트 체인 대신 소프트웨어에 인코딩된 결정적 제어 흐름이 필요하며, LLM을 전체 시스템의 구성요소로 다루는 결정적 스캐폴드의 중요성을 강조합니다.

  • 복잡한 에이전트에는 프롬프트 체인보다 결정적 제어 흐름이 필수적입니다.
  • 프롬프트에 `MANDATORY`, `DO NOT SKIP` 등에 의존하는 것은 프롬프팅의 한계에 도달했음을 의미합니다.
  • LLM을 전체 시스템이 아닌 구성요소로 다루는 결정적 스캐폴딩이 필요합니다.
  • 시스템 신뢰성을 높이려면 문제를 작은 덩어리로 쪼개고 모델 주변에 단순한 결정적 하네스를 만들어야 합니다.
  • 현재 AI 에이전트 기술은 "인간 개발팀의 잡무 상당 부분을 줄여주는 매우 유용한 도구"로 포지셔닝하는 것이 현실적입니다.
Notable Quotes & Details

AI 개발자, 에이전트 시스템 설계자, LLM 연구자

OpenAI, Codex에 “Pet” 기능 추가

OpenAI의 코드 생성 AI인 Codex에 'Pet' 기능이 추가되었다는 소식입니다.

  • OpenAI의 Codex에 새로운 'Pet' 기능 도입.
  • 사용자는 이 기능을 통해 코드 생성 과정을 더 재미있게 경험할 수 있을 것으로 예상.
  • 과거 Microsoft의 '누렁이'와 같은 유사 기능과의 비교를 통해 유행의 순환을 언급.
Notable Quotes & Details

개발자, AI 사용자, 일반 기술 뉴스 독자

Claude Mythos Preview로 Firefox를 강화한 비하인드 스토리

Mozilla가 Claude Mythos Preview를 활용하여 AI 생성 보안 보고서의 정확도를 높이고 Firefox에서 대규모 보안 버그를 발견하고 수정하는 파이프라인을 구축한 비하인드 스토리입니다.

  • Mozilla는 AI 모델 성능 향상과 하네스 개선을 통해 AI 생성 보안 보고서의 신호를 높이고 잡음을 줄임.
  • Firefox 150 릴리스에는 Claude Mythos Preview가 식별한 271개 버그 수정이 포함되었으며, 이는 기존 퍼징으로 찾기 어려운 공격 표면을 AI 분석이 더 포괄적으로 다룬 결과.
  • 공개된 주요 버그는 JIT의 가짜 객체 원시 기능, IPC 경합 조건으로 인한 부모 프로세스 UAF, NaN 역직렬화 문제, XSLT의 20년 된 rehash 버그 등 대부분 샌드박스 탈출과 관련.
  • Mozilla는 agentic 하네스를 기존 퍼징 인프라 위에 얹어 재현되지 않는 추측을 버리고 테스트케이스로 가설을 검증하며, 패치 시 지속적 통합 스캔을 계획.
  • 과거 AI 생성 보안 버그 보고서의 문제점(그럴듯하지만 틀린 경우)이 개선되어 짧은 기간 내에 상황이 크게 변화함.
Notable Quotes & Details
  • Firefox 150 release 에서는 Claude Mythos Preview 가 식별한 271개 버그가 수정됐고
  • XSLT의 20년 된 rehash 버그

보안 연구자, 웹 브라우저 개발자, AI/ML 엔지니어

프로그래밍은 형편없다 [2014]

소프트웨어 개발의 혼돈과 비합리적인 현실을 다리 건설에 비유하며, 프로그래밍의 어려움과 개발자들이 겪는 정신적 고통을 자조적으로 표현한 에세이입니다.

  • 모든 프로그래밍 팀은 비합리적으로 구성되어 있으며, 그 결과물 위에서 중요한 시스템(은행 소프트웨어, 인터넷)이 운영됨을 지적.
  • 완벽한 코드는 존재하기 어려우며, 현실은 촉박한 기한과 불완전한 도구, 지속적인 변화 속에서 이루어지는 임시방편적인 개발임을 강조.
  • 웹 개발자는 매주 새로운 기술을 배우고 수많은 기존 도구의 파손 여부를 확인해야 하는 고된 현실에 처해 있음.
  • 인터넷은 비공식적 합의와 오래된 코드에 의존하며, 시스템 관리자의 부재만으로 문명이 붕괴될 수 있는 취약한 구조.
  • 프로그래머는 뇌가 설계되지 않은 작업을 오랜 시간 수행하며 정신적 고통을 겪지만, 육체노동에 비해 편하다는 오해를 받음.
Notable Quotes & Details
  • [2014]
  • 600개의 눈송이 를 만들라는 지시

소프트웨어 개발자, 프로그래밍 입문자, 기술 분야 종사자

Notes: 에세이 형식의 주관적 내용이며, 2014년 작성된 글로 현재와 일부 차이가 있을 수 있음.

Show GN: Obsidian 우측 사이드바에서 Claude Code,Codex를 실행하는 Vault Terminal 플러그인을 만들었습니다

Obsidian 사용자들을 위해 Claude Code/Codex와 같은 에이전트 CLI 도구를 Obsidian 우측 사이드바에서 실행할 수 있는 Vault Terminal 플러그인이 개발되었다는 소식입니다.

  • Obsidian 사용자가 기존 터미널 플러그인의 PTY 동작, 스크롤, 색상 등 아쉬움을 해결하기 위해 Vault Terminal 플러그인 개발.
  • 현재 Obsidian 볼트 경로를 작업 디렉터리로 사용하여 claude, codex, git, npm 등 CLI 도구를 Obsidian 내에서 바로 실행 가능.
  • 프로젝트 문서, 설계 메모, 작업 로그를 Obsidian 노트에 열어두고 동시에 CLI 작업을 수행하는 워크플로우를 목표.
  • Windows/macOS 릴리스 ZIP 제공, Windows 기본 winpty 지원, Obsidian 테마에 맞춘 터미널 색상 등 다양한 기능 포함.
  • 초기 베타 버전으로, Node.js와 Claude Code/Codex CLI가 터미널 명령으로 실행 가능해야 함.
Notable Quotes & Details
  • GitHub: https://github.com/obst2580/obsidian-powershell
  • Release: https://github.com/obst2580/obsidian-powershell/releases

Obsidian 사용자, 개발자, AI 에이전트 사용자

Notes: 초기 베타 버전이며, 설치를 위해 Node.js 및 관련 CLI 도구의 사전 설치가 필요하다는 제한 사항 언급.

다중 시점 캡처를 통한 대규모 고품질 3D 가우시안 헤드 재구성

Apple Machine Learning Research에서 대규모 다중 시점 캡처를 통해 고품질 3D 가우시안 헤드를 재구성하는 HeadsUp이라는 확장 가능한 피드포워드 방식을 제안합니다.

  • HeadsUp은 효율적인 인코더-디코더 아키텍처를 사용하여 입력 뷰를 압축된 잠재 표현으로 변환합니다.
  • 잠재 표현은 중립 헤드 템플릿에 고정된 UV 매개변수화된 3D 가우시안 세트로 디코딩됩니다.
  • 10,000명 이상의 피험자로 구성된 내부 데이터셋으로 훈련 및 평가되었으며, 기존 데이터셋보다 규모가 훨씬 큽니다.
  • 최첨단 재구성 품질을 달성하고 테스트 시간 최적화 없이 새로운 신원에 일반화됩니다.
  • 잠재 공간의 강점을 활용하여 새로운 3D 신원 생성 및 표현 블렌드셰이프를 통한 3D 헤드 애니메이션과 같은 다운스트림 애플리케이션을 시연합니다.
Notable Quotes & Details

AI 연구자, 컴퓨터 비전 연구자

5% GPU 활용률: 기업들이 더 이상 무시할 수 없는 4010억 달러 규모의 AI 인프라 문제

기업들이 AI 인프라에 막대한 투자를 했음에도 불구하고 GPU 활용률이 5%에 불과하며, 이로 인해 4010억 달러 규모의 AI 인프라 문제가 발생하고 있음을 지적합니다.

  • 지난 24개월간의 "GPU 쟁탈전"으로 인해 많은 기업이 과도한 데이터 센터와 IT 예산을 편성했습니다.
  • 가트너는 올해 AI 인프라에 4010억 달러의 신규 지출이 예상된다고 추정합니다.
  • 기업의 평균 GPU 활용률은 5%에 불과하며, 이는 유휴 GPU를 해제하기 어려운 자체 강화적인 조달 루프에 의해 발생합니다.
  • 전통적인 감가상각 주기(3~5년)로 GPU 용량을 확보한 많은 조직은 이제 고정 비용으로 전환되어 활용 여부와 관계없이 생산성을 극대화해야 합니다.
  • 과소 활용되는 GPU는 단순히 유휴 자원이 아니라 가치가 하락하는 자산이며, 이제 측정 가능한 수익을 창출해야 합니다.
Notable Quotes & Details
  • Gartner estimates AI infrastructure is adding $401 billion in new spending this year
  • average GPU utilization in the enterprise is stuck at 5%

기업 임원, IT 관리자, 투자자

앤트로픽, AI 에이전트가 자신의 실수를 통해 학습할 수 있는 시스템 "Dreaming" 도입

Anthropic이 Claude Managed Agents 플랫폼에 AI 에이전트가 과거 세션에서 학습하고 스스로 개선할 수 있는 "dreaming"이라는 새로운 기능을 도입했습니다.

  • Anthropic은 Code with Claude 개발자 컨퍼런스에서 "dreaming" 기능을 포함한 Claude Managed Agents 플랫폼 업데이트를 발표했습니다.
  • "dreaming"은 AI 에이전트가 자신의 실수를 통해 학습하고 시간이 지남에 따라 개선될 수 있도록 합니다.
  • 이전 실험적 기능인 outcomes와 multi-agent orchestration도 공개 베타로 전환되어 개발자들이 광범위하게 사용할 수 있게 되었습니다.
  • 이러한 기능들은 AI 에이전트를 대규모로 운영할 때의 정확성 유지, 학습 지원, 복잡한 다단계 작업의 병목 현상 방지와 같은 어려운 문제를 해결합니다.
  • Legal AI 회사 Harvey는 dreaming 구현 후 작업 완료율이 약 6배 증가했으며, Medical document review 회사 Wisedocs는 outcomes를 사용하여 문서 검토 시간을 50% 단축했습니다.
Notable Quotes & Details
  • 80x annualized growth in revenue and usage
  • API volume on the Claude platform is up nearly 70x year over year
  • average developer using Claude Code now spends 20 hours per week working with the tool

AI 개발자, AI 연구자, 기업 임원

립-부 탄 체제 하에서 인텔 주가는 3배로 뛰었습니다. 하지만 그는 여전히 대부분의 직원들에게 계획을 말하지 않았습니다.

립-부 탄(Lip-Bu Tan)의 지휘 아래 인텔의 주가가 세 배 상승했지만, 대부분의 직원들에게는 그의 계획이 여전히 알려지지 않았으며, 관계 구축과 제조 실행 간의 괴리가 문제로 지적됩니다.

  • 립-부 탄이 CEO로 취임한 지 14개월 만에 인텔의 주가가 세 배 상승했습니다.
  • 그는 도널드 트럼프를 설득하고, 일론 머스크와 파트너십을 맺고, 애플의 관심을 끌었으며, 미국 정부를 인텔의 세 번째로 큰 주주로 만들었습니다.
  • 그러나 사내 직원들에게는 구체적인 제품 및 제조 계획을 설명하지 않았다는 비판이 있습니다.
  • 인텔은 시장 점유율을 되찾을 수 있는 제품과 경쟁사들이 수십억 달러를 지불할 만큼 충분히 좋은 제조 능력이 필요합니다.
  • 2025년 8월 미국 정부는 인텔에 89억 달러를 투자하여 9.9%의 지분을 확보했습니다.
Notable Quotes & Details
  • Intel’s stock has tripled under Lip-Bu Tan
  • The stock hit a record in April, surging 24 per cent in a single day
  • shares rose 114 per cent, the best month in Intel’s 55 years on the Nasdaq
  • The US government invested 8.9 billion dollars in Intel in August 2025

투자자, 비즈니스 분석가, 기술 산업 종사자

모두가 AI 세상을 지배하고 싶어합니다

AI 업계의 경쟁과 주요 인물들의 움직임을 다룹니다.

  • 오픈AI CEO 미라 무라티와 일론 머스크 간의 소송 및 갈등 분석
  • AI 주도권을 잡기 위한 거대 기술 기업들의 전략적 행보
  • AI 기술의 상업화와 윤리적 책임 사이의 균형 문제
  • 향후 AI 시장의 변화와 그에 따른 사회적 영향에 대한 전망
Notable Quotes & Details

일반 독자, 기술 산업 분석가

토큰 낭비를 멈추세요: LLM 파이프라인을 위한 JSON의 더 똑똑한 대안

LLM 파이프라인에서 구조화된 데이터를 효율적으로 전달하기 위한 TOON 형식을 소개합니다.

  • JSON은 데이터 통신 및 저장에 훌륭하지만, LLM 입력 시에는 중복된 필드명 등으로 인해 토큰 낭비가 발생함.
  • TOON(Token-Oriented Object Notation)은 JSON 데이터 모델을 유지하면서 토큰 사용량을 최적화하도록 설계된 형식.
  • 모델에게 더 명확한 구조적 단서를 제공하여 효율적인 추론을 가능하게 함.
  • 객체의 균일한 배열(Array of Objects)을 처리할 때 특히 강력한 성능을 발휘함.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

파이썬으로 밑바닥부터 벡터 검색 구축하기

임베딩과 유사도 점수를 활용하여 파이썬으로 벡터 검색 엔진을 구축하는 방법을 설명합니다.

  • 단순한 키워드 매칭의 한계를 극복하고 의미론적 검색을 구현하는 원리 설명.
  • 텍스트를 고차원 공간의 벡터로 변환하여 의미적 유사성을 계산하는 방법.
  • 두 문장에 겹치는 단어가 없어도 의미가 유사하면 가깝게 배치되는 모델의 특성 활용.
  • 파이썬을 사용하여 임베딩, 검색 로직, 결과 반환 과정을 단계별로 안내.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

해석 가능성을 통한 주석자 안전 정책 이해

데이터 주석 과정에서 발생하는 불일치의 원인을 해석 가능성 관점에서 분석합니다.

  • 안전 정책은 AI 출력의 안전성을 정의하는 핵심 가이드라인임.
  • 주석자 간의 불일치는 운영 실패, 정책의 모호성, 가치 다원주의 등 다양한 원인에서 발생함.
  • 이러한 원인을 명확히 구분하는 것이 품질 관리 및 정책 개선에 매우 중요함.
  • 해석 가능성 도구를 사용하여 주석자들이 왜 서로 다른 결정을 내리는지 심층적으로 탐구함.
Notable Quotes & Details

데이터 과학자, AI 정책 담당자

NeurIPS 2026 포지션 페이퍼 데스크 리젝트 [D]

한 연구자가 NeurIPS 2026에 제출한 포지션 페이퍼가 형식 위반으로 데스크 리젝트되었으며, 이전에 ICML에서도 경험적 평가 부족으로 거절당한 경험을 공유하며 다른 사람들의 경험을 묻는 내용입니다.

  • NeurIPS 2026에 제출된 포지션 페이퍼가 형식 위반으로 데스크 리젝트됨.
  • 제출자는 페이퍼 제목의 강도 부족을 데스크 리젝트 사유로 추측함.
  • 과거 ICML 제출 시에는 경험적 평가 부족으로 거절당한 경험이 있음.
  • 다른 연구자들의 유사한 경험 및 의견을 구하고 있음.
Notable Quotes & Details
  • Neurips 2026
  • ICML

AI 연구자, 학술 대회 제출 경험자

5개의 탭을 열어둘 필요 없도록 무료 AI 뉴스 피드를 만들었습니다. 신뢰할 수 있는 소스만 사용하며 30분마다 업데이트됩니다.

AI 뉴스를 한 곳에서 편리하게 볼 수 있도록 20개 이상의 신뢰할 수 있는 소스로부터 30분마다 업데이트되는 무료 AI 뉴스 피드 서비스 'AIWire'를 개발하여 출시했습니다.

  • AI 관련 뉴스를 한 곳에 모아 제공하는 무료 서비스 AIWire 출시.
  • 20개 이상의 신뢰할 수 있는 소스에서 30분마다 자동 업데이트.
  • OpenAI, Anthropic, Google DeepMind, MIT Technology Review 등 주요 AI 및 기술 미디어 포함.
  • 주요 기능으로 지난 24시간 Top Story, 소스/날짜/카테고리 필터링, 북마크 기능 제공.
Notable Quotes & Details
  • AIWire
  • 20+ trusted sources
  • every 30 minutes
  • aiwire.app

AI 개발자, 연구자, AI 뉴스 및 동향에 관심 있는 일반 독자

엣지 AI가 자율성, 로봇공학, 로컬 프라이빗 추론 중 어디에서 더 중요해질 것이라고 생각하시나요?

클라우드 중심의 AI 논의에서 벗어나 엣지 AI의 중요성이 부각되는 가운데, 엣지 AI가 자율성, 로봇공학, 로컬 프라이빗 추론 중 어느 분야에서 가장 큰 영향을 미칠지 논의를 제안하는 내용입니다.

  • AI 논의가 클라우드 중심에서 엣지 AI로 전환되는 추세.
  • 엣지 AI의 주요 적용 분야로 자율성 및 로봇공학, 저전력 비전 시스템, 로컬 LLM 및 온디바이스 추론, 대역폭 제한 산업 배포가 언급됨.
  • 향후 엣지 AI의 가장 중요한 영향 분야와 핵심 하드웨어/소프트웨어 스택에 대한 커뮤니티의 의견을 구함.
Notable Quotes & Details

AI 연구자, 개발자, AI 산업 관계자

ChatGPT를 구동하는 AI 착취 공장의 내부

ChatGPT의 발전을 뒷받침하는 숨겨진 인력의 열악한 노동 환경을 고발하며, 이들 중 거의 5분의 1이 노숙자로 전락하는 등 빅테크 기업이 운영하는 새로운 긱 이코노미의 어두운 면을 탐사 보도한 내용입니다.

  • ChatGPT 개발의 이면에 숨겨진 착취적인 노동 환경 존재.
  • 관련 인력 중 약 20%가 노숙자로 전락하는 심각한 사회 문제 발생.
  • 빅테크 기업이 주도하는 새로운 긱 이코노미의 부정적인 측면을 조명.
  • 탐사 보도 형식으로 문제의 심각성을 알리고 있음.
Notable Quotes & Details
  • 1 in 5
  • ChatGPT

일반 독자, AI 윤리 및 사회 문제에 관심 있는 사람

클라우드플레어, AI 에이전트를 위한 Git 스타일 버전 관리인 "Artifacts" 베타 출시

클라우드플레어는 AI 에이전트가 생성한 출력물의 버전을 관리하고 추적할 수 있는 Artifacts 베타를 출시했습니다.

  • 생산 환경에서 작동하는 자율 에이전트의 출력물, 상태 및 동작을 안정적으로 관리하는 문제 해결.
  • 에이전트가 생성한 코드, 설정 등을 구조화된 방식으로 저장하고 필요 시 롤백할 수 있는 기능 제공.
  • 전통적인 코드 관리 도구인 Git과 유사한 보장을 AI 기반 워크플로우에 도입하는 것이 목표.
  • 비결정적이고 일시적인 AI 출력물에 명확한 계보와 감사 가능성을 부여함.
Notable Quotes & Details

소프트웨어 개발자, AI 엔지니어

클릭 한 번으로 완전 셧다운: 스텔스 침입 차단을 위한 "Patient Zero" 웨비나

AI를 활용한 고도화된 스텔스 침입을 차단하기 위한 "Patient Zero" 전략을 다루는 웨비나를 소개합니다.

  • 사이버 보안의 가장 취약한 고리인 '사람'을 통한 최초 감염(Patient Zero) 방지 전략.
  • 2026년 해커들이 AI를 활용해 식별이 거의 불가능한 피싱 메일을 보내는 추세 분석.
  • 단일 장치의 침해로 인해 회사 전체가 마비되는 것을 막기 위한 실행 계획 제시.
  • 보안 담당자들을 위한 실질적인 대응 매뉴얼(Playbook) 공유.
Notable Quotes & Details

소프트웨어 개발자, 보안 관리자

주당 한 번의 놓친 위협: 2,500만 개의 알람이 저위험 리스크에 대해 밝힌 것

방대한 보안 알람 데이터 분석을 통해 저위험 카테고리에 숨겨진 실제 위협의 심각성을 경고합니다.

  • 엔터프라이즈 환경에서 무시되는 저위험 보안 알람 속에 실제 침투 시도가 숨어 있음.
  • 2,500만 개의 알람 데이터를 분석한 결과, 공격자들이 관리자의 주의가 소홀한 틈을 체계적으로 노림.
  • 심각도 중심의 보안 운영이 만들어낸 간극을 이해하고 전체 알람 사진을 분석할 필요성 강조.
  • 방어 체계의 허점을 메우기 위한 가시성 확보 전략 제시.
Notable Quotes & Details

보안 전문가, 시스템 관리자

새로운 리눅스 PamDOORa 백도어, SSH 자격 증명 탈취를 위해 PAM 모듈 사용

SSH 자격 증명을 탈취하고 지속적인 액세스를 유지하는 새로운 리눅스 백도어 PamDOORa에 대해 설명합니다.

  • PAM(Pluggable Authentication Module) 기반으로 설계되어 SSH 자격 증명을 가로챔.
  • 특정 매직 패스워드와 TCP 포트 조합을 통해 침입 후에도 지속적인 루트 권한 접근 유지 가능.
  • 리눅스 시스템의 보안 프레임워크인 PAM의 권한을 악용하여 탐지가 어려움.
  • 자격 증명 수집 및 무단 액세스를 허용하는 심각한 보안 리스크 경고.
Notable Quotes & Details

소프트웨어 개발자, 보안 연구원

"알트먼에 테슬라 이사 제안"… 머스크, 2018년 오픈AI 흡수 시도 드러나

일론 머스크 CEO가 오픈AI를 떠나기 직전, 테슬라에 통합하려고 했다는 사실이 밝혀졌다.

  • 이를 위해 샘 알트먼 CEO 등 경영진을 테슬라 이사회 멤버로 영입하려고 제안했다는 내용이다.
  • 파이낸셜타임스 등에 따르면, 2016년부터 오픈AI의 고문으로 활동했고 2020년부터 2023년까지 이사회 멤버였던 시본 질리스는 6일(현지시간) 법정에서 2018년 초 오픈AI 경영진을 상대로 AGI 달성을 위한 9가지 시나리오를 제안했다고 밝혔다.
  • 그중에는 알트먼 CEO를 포함한 핵심 멤버를 테슬라의 새로운 AI 연구소 책임자로 영입하려는 안이 포함됐다.
  • 이날 공개된 메시지에 따르면 머스크 CEO는 당시 오픈AI에 대한 신뢰를 잃은 상태였으며, 이에 따라 테슬라 내부에 AI 연구소를 만드는 방안을 모색하고 있었다.
  • 뉴럴링크 임원이었던 기술 전문가 질리스는 머스크 CEO 사이에 자녀 4명을 뒀으며, 이번 소송의 핵심 쟁점이 된 6개월 동안 양측 사이에서 중요한 소통 창구 역할을 했다.
Notable Quotes & Details

비즈니스 리더, 투자자, AI 산업 관계자

애플의 첫 AI 기기는 '카메라 탑재' 에어팟..."막바지 테스트 중"

애플이 AI 기반 차세대 웨어러블 전략에 속도를 내고 있다.

  • 카메라를 내장한 새로운 에어팟 프로(AirPods Pro) 개발은 막바지 단계까지 진행한 것으로 전해졌다.
  • 블룸버그는 7일(현지시간) 새로운 기능의 '시리'가 출시될 오는 9월 차세대 에어팟이 공개될 것으로 예상됐다.
  • 이 제품은 원래 올해 상반기 출시가 목표였지만, 통합 시리 개발 지연으로 일정이 미뤄졌다.
  • 현재 내부 테스트용 프로토타입은 DVT(Design Validation Test) 단계에 진입한 상태로, 사실상 최종 디자인과 핵심 기능 검증이 진행되고 있다.
  • 업계에서는 제품이 양산 직전 단계인 PVT(Production Validation Test)만 남겨둔 수준으로 평가하고 있다.
Notable Quotes & Details

비즈니스 리더, 투자자, AI 산업 관계자

그라비티, 1분기 영업익 308억원…전년比 24.7%↑

[지디넷코리아] 그라비티가 1분기 어닝 서프라이즈를 기록하며 양적·질적 성장을 이뤄냈다.

  • 첫 오픈월드 신작의 흥행을 바탕으로 하반기 다수의 PC 및 콘솔 신작을 통해 상승세를 이어간다는 방침이다.
  • 그라비티는 올해 1분기 매출 1619억원, 영업이익 308억원을 기록했다고 8일 밝혔다.
  • 전분기 대비 매출은 42.7%, 영업이익은 163.1% 급증했다.
  • 전년 동기 대비로도 각각 17.8%, 24.7% 증가하며 수익성을 크게 향상시켰다.
  • 1분기 호실적은 라그나로크 IP 기반 신작들이 이끌었다.
Notable Quotes & Details
  • 42.7%
  • 163.1%
  • 17.8%
  • 24.7%

AI 연구자, 학계

오케스트로, 국산 AI 반도체 생태계 키운다…112억원 R&D 사업 수행

[지디넷코리아] 오케스트로가 국산 인공지능(AI) 반도체 기반 클라우드 소프트웨어(SW) 시장 확대에 나선다.

  • 그래픽처리장치(GPU) 중심 AI 인프라 구조를 넘어 국산 신경망처리장치(NPU)·지능형 메모리 반도체(PIM) 생태계를 확대해 AI 인프라 자립도를 높인다는 목표다.
  • 오케스트로는 과학기술정보통신부와 정보통신기획평가원(IITP)이 추진하는 'AI 반도체 특화 클라우드 네이티브 SW 스택 및 모델 허브 기술 개발' 과제 주관기관으로 선정됐다고 8일 밝혔다.
  • 이번 사업은 총 112억 5000만원 규모 연구개발(R&D) 과제로, 오는 2029년까지 4년간 진행된다.
  • 국산 NPU와 PIM 등 차세대 AI 가속기가 범용 클라우드 환경에서도 안정적으로 활용될 수 있도록 클라우드 기반 운영 체계를 구축하는 것이 핵심이다.
  • 오케스트로는 이번 과제를 통해 AI 반도체 전용 클라우드 네이티브 SW 스택을 고도화할 계획이다.
Notable Quotes & Details

AI 연구자, 학계

Jooojub
System S/W engineer
Explore Tags
Series
    Recent Post
    © 2026. jooojub. All right reserved.