본문 바로가기

전체 글49

애플, 거대 멀티모달 모델(Large Multi-modal Model, LMM) 'Ferret' 공개 Apple's 'Ferret' is a new open-source machine learning model by Malcolm Owen, Product Comparison Expert Source: Apple Insider(Link) TL;DR 뜬금없이 크리스마스 이브날에 애플이 새로운 LMM(Large Multi-modal Model)을 공개했다고 기사가 떴다. 사실 공개는 진작에 했는데 기사화를 크리스마스 기념으로 이번에 한 듯 함. 생각해보니 의외로 애플 정도의 회사가 아직 ChatGPT나 LLaMA와 경쟁할 모델을 내놓지 않았었다. 그나저나 요즘 모델에 동물 이름 붙이는 게 유행인듯 한데(라마, 알파카, 오르카..), 이번엔 페럿이다. 귀엽네.. Researchers working for App.. 2023. 12. 27.
AWS Solutions Architect Associate(SAA-C03) 기출문제 정리 - 03 인덱스 요구사항 솔루션 1-21 Docker 컨테이너에서 앱을 구축 후 AWS에서 앱을 실행하고, 관리 서비스를 사용해 앱을 호스팅해야 함 서비스 수용에 따라 적절히 확장 및 축소되어야 함 관리에 추가 운영 오버헤드나 인프라를 초래해선 안됨 Fargate와 함께 ECS(Elastic Container Service) 이용 Fargate와 함께 EKS(Elastic Kubernetes Service) 이용 1-22 비디오 처리를 위해 최대 I/O 성능 및 최소 10TB의 스토리지 필요 내구성이 뛰어난 300TB의 미디어용 스토리지 사용하지 않는 아카이브 미디어용 900TB 스토리지 최대 성능을 위한 EC2 인스턴스 스토어 내구성 있는 데이터 스토리지를 위한 S3, 아카이브 스토리지를 위한 S3 Glacie.. 2023. 12. 27.
Objective Function 이해하기 - 01. Probability와 Likelihood의 차이 'Probability(확률)'와 'Likelihood(가능도 또는 우도)'는 비슷한 개념처럼 보이지만 서로 다른 의미를 가짐. Probability는 어떤 사건이 발생할 가능성의 정도로, 일반적으로 0과 1 사이의 값으로 표현됨. 확률이 0이면 사건이 전혀 발생하지 않을 것을, 확률이 1이면 사건이 반드시 발생할 것을 의미함. 확률은 특정 조건이나 주어진 정보에 기반하여 계산됨. 이에 비해, Likelihood는 주어진 데이터(또는 결과값)에 대한 특정 통계 모델, 또는 매개변수 집합의 적합성을 측정함. Likelihood는 주어진 데이터가 관찰되었을 때, 그 데이터가 어느 정도나 특정 모델 또는 매개변수 값으로부터 '가능한가'를 나타냄. Likelihood는 확률과 달리 확률 분포의 일부가 아니며, .. 2023. 12. 19.
AWS Solutions Architect Associate(SAA-C03) 기출문제 정리 - 02 인덱스 요구사항 솔루션 1-11 Real-time Messaging Protocol 이용한 뉴스 라이브 방송 서비스 최고 품질의 스트림과 가속화된 TCP 연결 제공 필요 Global Accelerator를 이용하여 가속화된 TCP 제공 1-12 단일 VPC, 다수 가용영역의 다수 EC2에서 미디어 제공 모든 EC2 간 데이터 공유 가능한 고성능 솔루션 필요 데이터를 VPC 내에서만 유지해야 함 Elastic File System(EFS)를 구성하고 모든 EC2에 마운트 Elastic Block Store(EBS)는 단일 가용영역에서만 사용 가능 1-13 다수 가용영역에 배포되는 웹 앱 공유 스토리지 솔루션 웹 앱은 Auto Scaling 그룹의 EC2에서 실행 콘텐츠가 수시로 변경되며, 즉시 새 콘텐츠가.. 2023. 12. 19.
AWS Solutions Architect Associate(SAA-C03) 기출문제 정리 - 01 인덱스 요구사항 솔루션 1-1 온프레미스 NFS 서버의 데이터를 AWS 클라우드로 마이그레이션 짧은 지연시간 액세스 유지 필요 Storage Gateway 배포 후 File Gateway(NFS 지원, 짧은 지연시간)를 이용해 S3에 데이터 저장 로컬 캐시를 이용해 짧은 지연시간 유지 1-2 S3에 저장된 많은 양의 콘텐츠를 수백만 명의 사용자에게 제공 원본 부하를 줄이면서 제공 S3 버킷 앞에 CloudFront를 이용해 배포 원본 콘텐츠를 Edge location에 캐싱 Global Accelerator는 원본 부하 감소가 목적이 아닌 라우팅 속도 향상 목적 1-3 AWS 계정에 대한 공격을 모니터링하고 방지해야 함 악의적 활동을 모니터링하고 보안 결과를 제공하는 GuardDuty 서비스 이용 1-4.. 2023. 12. 18.
검색증강생성(RAG): 벡터 DB 기초 TL; DR 우리가 어떤 목적이나 데이터에 특화된 customized LLM 앱을 만들고 싶다고 해 보자. 그러면 사용자가 가진 데이터(예: 책, 대화 기록, 기술 문서 등)을 모델에게 추가로 학습시켜야 하는데, LLM을 학습시키는 것은 상당히 높은 컴퓨팅 자원을 요구한다. 그 뿐 아니라, LLM에 맞게 데이터셋과 코드를 별도로 구축해야 하는 번거로움이 있다. 이 때 하나의 대안이 되는 방법이 검색 증강 생성(RAG)이며, 벡터 DB는 RAG 프레임워크의 주요 구성 요소이다. 이 포스트에서는 먼저 RAG와 벡터 DB의 기초 개념과 그 활용 양상에 대해 간단히 살펴본다. 벡터 벡터는 길이와 방향을 가진 수학적 객체를 말한다. 이는 $n$차원 벡터 공간에서의 위치를 나타내며, 이 위치는 길이가 $n$인 1차.. 2023. 11. 1.
[AWS] 확장성(Scalability)과 가용성(Availability) 확장성(Scalability) 수직적 확장(Vertical scalability): 자원을 추가하는 것, 예를 들어, EC2의 t2.mircro 인스턴스를 t2.large 인스턴스로 업그레이드 하는 것. 수평적 확장(Horizontal scalability): 노드를 추가하는 것. 예를 들어, EC2 인스턴스의 갯수를 늘리는 것. 탄력성(Elasticity)이라고도 함 고가용성(High Availability) 지속적으로 정상 운영이 가능한 상태 이중화(Duplication): 하나의 가용 영역에 이상이 생겨도 다른 시스템으로 지속적인 운영이 가능한 설계 이미지 출처 https://www.stormit.cloud/blog/scalability-in-cloud-computing-horizontal-vs-v.. 2023. 8. 20.
[AWS] EC2 인스턴스 시작하기 이름 및 태그 인스턴스 이름 지정 태그를 추가할 수 있음 태그를 지정하면 인스턴스 정보 조회(비용 등) 시 태그 단위로 정보를 볼 수 있음 앱 및 OS 이미지(Amazon Machine Image, AMI) 인스턴스의 운영 체제(Operation System; OS) 더 많은 AMI를 보면 여러 AMI를 볼 수 있음 내 AMI에서 사용자가 지정한 AMI 사용 가능 Marketplace AMI는 협력업체에서 구성한 AMI로 손쉽게 서비스를 구축할 수 있음. 보통 유료 인스턴스 유형 선택 성능, 요금, 목적을 고려하여 선택 '인스턴스 유형 비교'에서 다양한 인스턴스 유형의 상세 사항 볼 수 있음 키 페어 원격 접속할 때 보안 접속을 위해 사용 실습 일단 RSA, .pem 선택 다운로드되면 잘 보관해놓기 네트.. 2023. 7. 16.
Meta, OpenAI·구글과 경쟁할 오픈소스 상용 AI 모델 출시 Meta to release open-source commercial AI model to compete with OpenAI and Google Meta, OpenAI·구글과 경쟁할 오픈소스 상용 AI 모델 출시 Developers could use the open-source LLM to build generative AI applications, like ChatGPT, for startups or established businesses. 개발자들은 오픈 소스 LLM을 사용하여 스타트업이나 기성 기업을 위한 ChatGPT와 같은 생성적 AI 애플리케이션을 구축할 수 있습니다. by Maria Diaz, Staff Writer Source: https://www.zdnet.com/article/me.. 2023. 7. 16.
신규성(Novelty)이 사라지면서 트래픽이 약 10% 감소한 ChatGPT ChatGPT Drops About 10% in Traffic as the Novelty Wears Off 새로움이 사라지면서 트래픽이 약 10% 감소한 ChatGPT by David F. Carr, Senior Insights Manager Source: https://www.similarweb.com/blog/insights/ai-news/chatgpt-traffic-drops/ ChatGPT Drops About 10% Traffic as Novelty Wears Off | Similarweb Worldwide traffic dropped 9.7% and unique visitors were down 5.7% in June. The amount of time visitors spent with th.. 2023. 7. 9.
[AWS] IAM(Identity and Access Management) IAM(Identity and Access Management) AWS 계정 및 권한 관리 서비스 AWS 서비스와 리소스에 대한 액세스 관리 사용자, 그룹, 역할, 정책으로 구성 리전에 속하는 서비스가 아닌 글로벌 서비스 계정 보안 강화를 위해 루트 계정은 최초 사용자 계정 생성 이후 가능하면 사용하지 말 것 사용자 계정으로 서비스를 사용하고 필요한 최소한의 권한만 부여(최소 권한의 원칙) 루트 계정과 개별 사용자 계정에 강력한 암호 정책과 멀티팩터 인증(MFA) 적용 사용자 암호에 대한 복잡성 요구 사항과 의무 교체 주기를 정의 IAM 액세스 관리 사용자(User): 사람, ID, 계정 그룹(Group): 사용자의 모음 역할(Role): AWS 리소스에서 사용하는 자격 증명(예: EC2에서 실행되는 앱.. 2023. 7. 8.
[AWS] 비용 관리(Budgets, Cost Explorer)와 리전(Region) AWS Budgets(예산) 임계값을 초과하면 수행할 작업 설정할 수 있음(인스턴스를 정지하는 등) IAM 권한 필요 AWS Cost Explorer(비용 탐색기) 그래프, 숫자를 통한 시각화 인테페이스 제공 보고서 다운로드 가능 리전(Region) 데이터 센터를 클러스터링하는 물리적 위치 1개 AWS 리전 = 2개 이상 가용 영역으로 구성 대부분 AWS 서비스는 리전을 선택하여 시작 글로벌 서비스는 리전을 선택하지 않음(예: IAM) 재해복구(DR) 설계 = 2개 이상의 리전에 시스템을 배치 가용 영역(Availability Zone; AZ) 하나 이상의 개별 데이터 센터 1개 리전은 2개 이상, 보통 3-4개 가용 영역으로 구성 가용 영역끼리는 고속 네트워크로 연결 고가용성(High Availabil.. 2023. 6. 18.