1. 개요 (Overview)**온디바이스 AI(On-Device AI)**란 외부 서버나 클라우드를 거치지 않고 스마트폰, PC, 웨어러블, 자동차 등 기기 자체에서 인공지능 연산을 직접 수행하는 기술을 의미합니다. 기존의 클라우드 AI가 데이터를 서버로 전송하여 결과를 받아오는 방식이었다면, 온디바이스 AI는 기기 내부의 하드웨어(NPU 등)를 활용해 즉각적으로 결과를 도출합니다.2. 핵심 기술 스택 (Tech Stack)1) 하드웨어 레이어 (Hardware)NPU (Neural Processing Unit): AI 연산(행렬 연산)에 최적화된 전용 프로세서입니다. Apple의 Neural Engine, 퀄컴의 Hexagon, 삼성의 Exynos NPU 등이 대표적입니다.GPU & DSP: 그래픽 ..
1. 개요 (Overview)**HBM(고대역폭 메모리)**은 여러 개의 D램 칩을 수직으로 쌓아 올려 데이터 전송 속도를 혁신적으로 높인 고성능 메모리입니다. 기존 GDDR(Graphic DDR) 계열의 메모리가 가진 물리적 한계(공간 차지, 전력 소모, 대역폭 제한)를 극복하기 위해 개발되었으며, 주로 GPU(그래픽 처리 장치)와 같은 고성능 프로세서 바로 옆에 배치되어 '데이터 병목 현상'을 해결하는 역할을 합니다.2. 핵심 기술 스택 (Tech Stack)HBM의 성능을 가능하게 하는 핵심 제조 공정 및 기술은 다음과 같습니다.TSV (Through Silicon Via, 실리콘 관통 전극):D램 칩에 수천 개의 미세한 구멍을 뚫어 상하층 칩을 전극으로 직접 연결하는 기술입니다. 기존의 와이어 본..
1. 개요 (Overview)sLLM은 수천억 개의 매개변수(Parameter)를 가진 대형 언어 모델(LLM)과 달리, 대략 수십억 개에서 수백억 개(주로 1B~30B 사이)의 매개변수를 가진 경량화된 언어 모델입니다. '작지만 강력한' 모델을 지향하며, 특정 도메인이나 산업군에 특화된 학습을 통해 특정 작업에서 LLM에 준하는 성능을 내는 것이 목적입니다.배경비용 문제: GPT-4와 같은 초대형 모델은 운영 및 추론 비용이 막대함.보안 이슈: 민감한 데이터를 외부 클라우드 AI에 보내지 않고 내부적으로 처리하려는 수요 증가.속도 요구: 실시간 응답이 필요한 서비스나 단말기 자체(On-device) 처리가 필요함.2. 핵심 기술 스택 (Tech Stack)sLLM은 단순히 크기만 줄인 것이 아니라, 효..
1. 개요 (Overview)**RAG(Retrieval-Augmented Generation, 검색 증강 생성)**는 대규모 언어 모델(LLM)이 텍스트를 생성하기 전에 외부의 신뢰할 수 있는 지식 베이스에서 관련 정보를 **검색(Retrieval)**하여 그 내용을 바탕으로 답변을 **생성(Generation)**하는 기술입니다.LLM은 학습 데이터에 포함되지 않은 최신 정보나 기업 내부의 비공개 데이터를 알지 못하며, 사실이 아닌 정보를 그럴듯하게 말하는 '환각(Hallucination)' 현상이 발생할 수 있습니다. RAG는 모델을 재학습(Fine-tuning)시키지 않고도 외부 데이터를 참조하게 함으로써 이러한 한계를 극복합니다.2. RAG의 작동 원리 (Architecture)RAG의 프로세스..
최근 글로벌 스마트폰 제조사들이 폴더블폰과 가성비를 앞세운 중저가 라인업을 통해 한국 시장 공세에 속도를 내고 있습니다. 삼성전자가 주도하고 있는 국내 시장에서 중국의 샤오미와 대만의 에이수스 등이 차별화된 하드웨어 스펙과 공격적인 가격 정책을 바탕으로 점유율 확대를 꾀하고 있습니다.외산폰 브랜드별 국내 출시 및 시장 전략1. 샤오미: 라이카 협업 및 프리미엄 전략샤오미는 단순 가성비를 넘어 프리미엄 카메라 성능을 강조하며 국내 소비자층을 공략하고 있습니다. 특히 라이카(Leica)와의 기술 협업을 통해 사진 품질을 극대화한 전략 모델을 선보였습니다.주요 특징: 라이카 광학 렌즈 탑재, 고속 충전 기술 지원유통 채널: 자급제 채널 확대 및 국내 공식 서비스 센터 확충 추진가격 전략: 삼성·애플 대비 낮은..
구글이 전 세계 앱 개발사를 대상으로 결제 시스템 수수료를 인하하는 새로운 정책을 시행합니다. 이번 조치는 기존 30%였던 수수료율을 연간 매출액 100만 달러 이하 구간에 대해 15%로 낮추는 내용을 골자로 하며, 국내 개발사들의 수익성 개선에도 영향을 미칠 전망입니다.수수료 인하 정책의 핵심 내용구글의 공식 발표에 따르면, 이번 수수료 개편은 규모와 상관없이 모든 개발사에게 적용됩니다. 주요 변경 사항은 다음과 같습니다.1. 매출 구간별 차등 수수료 도입연간 매출 100만 달러(약 13억 원) 이하: 기존 30%에서 15%로 인하연간 매출 100만 달러 초과: 초과분부터는 기존과 동일하게 30% 유지2. 적용 범위 및 방식대상: 구글 플레이 스토어를 통해 유료 콘텐츠 및 디지털 서비스를 판매하는 전 ..
2026년 글로벌 메모리 반도체 수급 불균형이 심화되면서 스마트폰과 PC 등 주요 IT 기기의 가격 인상이 본격화될 전망입니다. 인공지능(AI) 데이터센터 수요 폭증으로 인한 메모리 공급 쏠림 현상이 범용 제품의 가격 상승과 출하량 감소로 이어지고 있습니다.AI 데이터센터가 불러온 '메모리 블랙홀' 현상최근 반도체 시장은 AI 서버용 고대역폭메모리(HBM)와 고용량 DDR5 생산에 자원이 집중되면서, 기존 스마트폰과 PC에 사용되는 범용 DRAM 및 NAND 플래시 공급이 구조적으로 제한받고 있습니다.공급 우선순위 변화: 삼성전자, SK하이닉스 등 주요 제조사들이 수익성이 높은 HBM 증설에 집중하면서 범용 메모리 생산 라인이 축소되었습니다.가격 급등: 시장조사업체 트렌드포스(TrendForce)에 따르..
- Total
- Today
- Yesterday
- Javascript
- 스마트안경
- 엣지컴퓨팅
- 멀티모달
- on-device ai
- HBM
- react
- prompt engineering
- SSR
- Nextjs
- 카카오
- CSR
- java
- 웹기초
- 협력
- MSA
- LLM
- 구글
- CSS
- It용어
- Rag
- HTML
- TypeScript
- AI
- sLLM
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
| 29 | 30 | 31 |