Azure managed 애플리케이션 을(를) 사용하여 고객 Azure 계정 및 가상 네트워크(VNet)에 Voyage AI 모델을 실시간 추론 API 엔드포인트로 배포 수 있습니다. Azure managed 애플리케이션은 다음과 같은 주요 이점을 제공합니다.
데이터 흐름 및 액세스 제어: 데이터가 가상 네트워크를 벗어나지 않으므로 타사 또는 멀티 테넌트 서비스와 관련된 데이터 개인정보 보호 위험을 해결합니다.
Azure 가 지원하는 안정성 및 컴플라이언스: Azure 유일한 하위 프로세서 역할을 하므로 사용자는 Azure의 모든 안정성 및 컴플라이언스 보장 상속받습니다.
Azure 통한 청구 및 결제: 기존 Azure 청구 정보 및 크레딧을 사용하여 Voyage AI 모델을 구매하면 별도의 타사 결제 및 청구 시스템을 관리 할 필요가 없습니다.
사용 가능한 모델
배포 할 수 있는모델을 확인하려면 Azure Marketplace에서 "Voyage AI by MongoDB "를 검색 .
Voyage AI 모델에 대해 자세히 학습 모델 개요를 참조하세요.
가격
Voyage AI 모델을 사용하는 Azure managed 애플리케이션은 시간당 요금이 청구됩니다. 총 시간당 비용 은 가상 머신(VM) 가격(시간당 $5)과 해당 리전 의 기본 인스턴스 가격을 합한 금액입니다. 이 managed Azure 애플리케이션 에 대한 관리 비용 없으므로 나열된 Azure managed 애플리케이션 월별 요금은 $0입니다.
전제 조건
Voyage Azure managed 애플리케이션 배포 하려면 다음이 필요합니다.
기존 Azure 구독.
Voyage Azure managed 애플리케이션 배포 위한 기존 가상 네트워크입니다. 지침은 가상 네트워크 생성 섹션을 참조하세요.
선택한Voyage Azure managed 애플리케이션 에 필요한 인스턴스 패밀리에 충분한 GPU vCPU 할당량. 할당량을 확인하거나 할당량 증가를 요청 방법을 학습 할당량 섹션을 참조하세요.
모든 사전 조건을 충족하는 경우 가상 네트워크에 Voyage API 엔드포인트 배포 섹션으로 건너뛰세요.
Quota
이 섹션에는 할당량을 확인하고 필요한 경우 증가를 요청 방법에 대한 지침 포함되어 있습니다. 할당량이 충분한 경우 이 섹션을 건너뛰세요.
Check Quota
Azure Portal에서 구독으로 고 (Go) .
Verify quota.
배포 하려는Voyage Azure managed 애플리케이션의 수에 맞는 GPU vCPU 할당량이 충분한지 확인합니다. 할당량이 충분하지 않은 경우 다음 섹션( 할당량증가 요청)으로 이동하여 할당량을 추가로 요청 .
할당량 증가 요청
원하는 구독 의 사용량 + 할당량 페이지에서 할당량 증가를 요청 수 있습니다.
가상 네트워크 만들기
Voyage Azure managed 애플리케이션 배포 하려는 기존 가상 네트워크가 이미 있는 경우 이 섹션을 건너뛰세요.
가상 네트워크에 Voyage API 엔드포인트 배포
이 섹션에서는 가상 네트워크에Voyage Azure managed 애플리케이션 배포 .
Azure Marketplace에서 Voyage API 엔드포인트를 배포하는 데 도움이 필요한 경우 MongoDB 지원 문의 .
Voyage API 엔드포인트 액세스
배포가 완료되면 동일한 가상 네트워크 내의 모든 서비스에서 HTTP 요청을 통해 Voyage API 엔드포인트에 액세스할 수 있습니다.
Bastion 가상 머신 만들기
Voyage API 엔드포인트에 액세스 방법을 보여 주기 위해 동일한 가상 네트워크 내에 Bastion 가상 머신을 생성해 보겠습니다. 모델 엔드포인트를 쿼리 위해 네트워크의 다른 기존 머신/서버를 사용하거나 사용하려는 경우 이 섹션을 건너뛰고 Invoke Voyage API Endpoint(Voyage API 엔드포인트 호출) 섹션으로 건너뛸 수 있습니다.
이 절차는 데모 목적으로만 저비용 가상 머신 구성을 안내합니다. 고급 사용자인 경우 사용자 지정 구성을 만들 수 있습니다.
기본 사항
기본 사항 탭 의 필드를 채웁니다. 완료되면 다음을 클릭합니다.
필드 | 값 |
|---|---|
서브스크립션 | 구독 선택합니다. |
리소스 그룹 | Voyage API 엔드포인트가 포함된 리소스 그룹 선택합니다. |
가상 머신 이름 | 가상 머신의 이름을 입력합니다. |
리전 | Voyage API 엔드포인트의 리전 선택합니다. |
가용성 옵션 | '인프라 중복성 필요 없음'을 선택합니다. |
보안 유형 | '표준'을 선택합니다. |
이미지 | ' Ubuntu Server 24.04 LTS - x64 Gen2'을 선택합니다. |
VM 아키텍처 | "x64"를 선택합니다. |
Azure 스폿 할인으로 실행 | 확인란을 선택하지 않은 상태로 둡니다. |
size | 'Standard_B1- 1 vcpu, 1GiB 메모리'를 선택합니다. |
최대 절전 모드 활성화 | 확인란을 선택하지 않은 상태로 둡니다. |
인증 유형 | 'SSH 공개 키'를 선택합니다. |
사용자 이름 | "voyage"를 입력합니다. |
SSH 공개 키 소스 | '새 키 쌍 생성'을 선택합니다. |
SSH 키 유형 | "RSA SSH 형식"을 선택합니다. |
키 쌍 이름 | 'vm-voyage_key'를 입력합니다. |
공용 인바운드 포트 | '선택한 포트 허용'을 선택합니다. |
인바운드 포트 선택 | 'SSH(22)'를 선택합니다. |
디스크
디스크 탭 의 필드를 채웁니다. 완료되면 다음을 클릭하여 네트워킹으로 이동합니다.
필드 | 값 |
|---|---|
호스팅하다 에서 암호화 | 확인란을 선택하지 않은 상태로 둡니다. |
OS disk size | '이미지 기본값 (30 GiB)'을 선택합니다. |
OS disk type | '표준 하드디스크(로컬 중복 저장)'를 선택합니다. |
VM으로 삭제 | 확인란을 선택합니다. |
키 관리 | '플랫폼 관리형 키'를 선택합니다. |
울트라 디스크 호환성 활성화 | 확인란을 선택하지 않은 상태로 둡니다. |
Networking
네트워킹 탭 의 필드를 채웁니다. 완료되면 Review + create를 클릭합니다.
필드 | 값 |
|---|---|
가상 네트워크 | 중요. Voyage API 엔드포인트가 배포된 가상 네트워크를 선택합니다. |
서브넷 | 중요. 가상 네트워크 내에서Voyage API 엔드포인트가 배포된 서브넷을 선택합니다. |
공개 IP | 중요. 새 공용 IP 만듭니다. 이를 생성하지 않으면 가상 네트워크 외부에서 가상 머신 액세스 할 수 없습니다. |
NIC 네트워크 보안 그룹 | '기본'을 선택합니다. |
공용 인바운드 포트 | '선택한 포트 허용'을 선택합니다. |
인바운드 포트 선택 | 'SSH(22)'를 선택합니다. |
VM 삭제 시 공용 IP 및 NIC 삭제 | 확인란을 선택하지 않은 상태로 둡니다. |
가속화된 네트워킹 활성화 | 확인란을 선택하지 않은 상태로 둡니다. |
로드 밸런싱 옵션 | "없음"을 선택합니다. |
검토 및 생성
Voyage API 엔드포인트 호출
요청 합니다.
다음 엔드포인트를 사용하여 Voyage API 에 요청 수 있습니다: http://{voyage-app-vnet-private-ip}/embeddings.
curl -X GET "http://10.0.0.4/embeddings" \ -H "Content-Type: application/json" \ -d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}
Voyage API 애플리케이션 삭제
Voyage API 엔드포인트를 삭제 하려면 애플리케이션 으로 이동하여 Overview(개요) 섹션에서 Delete(삭제) 버튼을 클릭합니다. 표시되는 대화 상자에서 예를 클릭하여 삭제를 확인합니다. 이렇게 하면 연결된 managed 리소스 그룹 도 삭제됩니다.
Bastion 가상 머신 삭제
Bastion 가상 머신을 프로비저닝한 경우 낭비되는 비용과 예기치 않은 요금이 발생하지 않도록 가상 머신을 삭제 .