Docs Menu
Docs Home
/

Azure Marketplace를 사용하여 Voyage AI 모델 배포

Azure managed 애플리케이션 을(를) 사용하여 고객 Azure 계정 및 가상 네트워크(VNet)에 Voyage AI 모델을 실시간 추론 API 엔드포인트로 배포 수 있습니다. Azure managed 애플리케이션은 다음과 같은 주요 이점을 제공합니다.

  1. 데이터 흐름 및 액세스 제어: 데이터가 가상 네트워크를 벗어나지 않으므로 타사 또는 멀티 테넌트 서비스와 관련된 데이터 개인정보 보호 위험을 해결합니다.

  2. Azure 가 지원하는 안정성 및 컴플라이언스: Azure 유일한 하위 프로세서 역할을 하므로 사용자는 Azure의 모든 안정성 및 컴플라이언스 보장 상속받습니다.

  3. Azure 통한 청구 및 결제: 기존 Azure 청구 정보 및 크레딧을 사용하여 Voyage AI 모델을 구매하면 별도의 타사 결제 및 청구 시스템을 관리 할 필요가 없습니다.

배포 할 수 있는모델을 확인하려면 Azure Marketplace에서 "Voyage AI by MongoDB "를 검색 .

Voyage AI 모델에 대해 자세히 학습 모델 개요를 참조하세요.

Voyage AI 모델을 사용하는 Azure managed 애플리케이션은 시간당 요금이 청구됩니다. 총 시간당 비용 은 가상 머신(VM) 가격(시간당 $5)과 해당 리전 의 기본 인스턴스 가격을 합한 금액입니다. 이 managed Azure 애플리케이션 에 대한 관리 비용 없으므로 나열된 Azure managed 애플리케이션 월별 요금은 $0입니다.

Voyage Azure managed 애플리케이션 배포 하려면 다음이 필요합니다.

  • 기존 Azure 구독.

  • Voyage Azure managed 애플리케이션 배포 위한 기존 가상 네트워크입니다. 지침은 가상 네트워크 생성 섹션을 참조하세요.

  • 선택한Voyage Azure managed 애플리케이션 에 필요한 인스턴스 패밀리에 충분한 GPU vCPU 할당량. 할당량을 확인하거나 할당량 증가를 요청 방법을 학습 할당량 섹션을 참조하세요.

모든 사전 조건을 충족하는 경우 가상 네트워크에 Voyage API 엔드포인트 배포 섹션으로 건너뛰세요.

이 섹션에는 할당량을 확인하고 필요한 경우 증가를 요청 방법에 대한 지침 포함되어 있습니다. 할당량이 충분한 경우 이 섹션을 건너뛰세요.

1
2

Azure managed 애플리케이션 에 사용할 구독 선택합니다. 다음 예시 에서는 '종량제' 구독 선택합니다. 구독 페이지의 설정에서 사용량 + 할당량을 선택합니다.

3

검색 창에서 선택한Voyage Azure managed 애플리케이션 에 필요한 GPU 인스턴스 패밀리를 검색합니다. 예시 들어Standard_NC40ads_H100_v5 또는 입니다.Standard_NC24ads_A100_v4 원하는 리전 의 리전을 필터링합니다. 아래 예시 에서는 '미국 서부 2 '에 대한 리전 필터링했습니다.

4

배포 하려는Voyage Azure managed 애플리케이션의 수에 맞는 GPU vCPU 할당량이 충분한지 확인합니다. 할당량이 충분하지 않은 경우 다음 섹션( 할당량증가 요청)으로 이동하여 할당량을 추가로 요청 .

원하는 구독 의 사용량 + 할당량 페이지에서 할당량 증가를 요청 수 있습니다.

1

선택한 Voyage Azure managed 애플리케이션 에 필요한 GPU 인스턴스 제품군 할당량 확인란을 선택합니다. 할당량 요청 드롭다운을 선택하고 새 한도 입력을 선택합니다. 새 할당량 요청 패널이 나타납니다.

2

새 할당량 요청 패널의 새 제한 필드 에 원하는 할당량을 입력합니다. 제출을 클릭합니다.

Voyage Azure managed 애플리케이션 배포 하려는 기존 가상 네트워크가 이미 있는 경우 이 섹션을 건너뛰세요.

1
2

'가상 네트워크'를 검색합니다. 결과에서 가상 네트워크를 선택합니다.

3
4

기본 사항 탭 의 필드를 채웁니다.

필드

서브스크립션

구독 선택합니다.

리소스 그룹

기존 리소스 그룹 선택하거나 새 리소스 그룹 만듭니다.

가상 네트워크 이름

가상 네트워크의 이름을 입력합니다.

리전

원하는 리전 선택합니다. 이 리전 에 필요한 리소스 할당량이 있어야 합니다.

5

보안, IP 주소, 태그와 같은 몇 가지 고급 구성이 있습니다. 고급 구성 요구 사항이 있는 경우 해당 탭에 입력합니다. Voyage에서는 애플리케이션 배포 위해 고급 구성이 필요하지 않습니다. 고급 구성이 필요하지 않거나 잘 모르는 경우 Review + create(검토 + 생성)를 클릭하여 애플리케이션 직접 검토 하고 생성합니다.

6

Review + create 탭 에서 구성을 검토 Create를 클릭하여 확인합니다. 그렇지 않으면 이전 버튼이나 해당 탭을 클릭하여 변경합니다.

7

가상 네트워크 생성을 확인합니다. 생성되는 동안 '배포 진행 중' 상태가 표시됩니다.

가상 네트워크가 성공적으로 생성되면 상태가 ' 배포서버 완료되었습니다'로 변경됩니다.

이 섹션에서는 가상 네트워크에Voyage Azure managed 애플리케이션 배포 .

1

Azure Marketplace에서구독 하려는 Voyage Azure managed 애플리케이션 선택합니다.

2
3
4

드롭다운 메뉴에서 구독 과 "표준 요금제"를 선택하고 만들기를 클릭하여 표준 요금제 Azure managed 애플리케이션 만듭니다.

5

기본 사항 의 필드를 채웁니다. 다음을 클릭하여 네트워크 설정으로 이동합니다.

필드

서브스크립션

구독 선택합니다.

리소스 그룹

원하는 가상 네트워크가 포함된 리소스 그룹 선택합니다.

리전

원하는 리전 선택합니다. 이 리전 에 필요한 리소스 할당량이 있어야 합니다.

애플리케이션 이름

애플리케이션 의 이름을 입력합니다.

관리형 리소스 그룹

managed 리소스 그룹 의 이름을 입력합니다.

6

네트워크 설정 탭 의 필드를 채웁니다. 완료되면 다음을 클릭합니다.

필드

기존 가상 네트워크를 선택합니다(새 vnet을 만들지 않음).

원하는 기존 가상 네트워크를 선택합니다. Voyage API 엔드포인트는 이 가상 네트워크에 배포됩니다.

HTTP 트래픽을 허용하는 서브넷 선택 또는 생성

원하는 서브넷을 선택합니다. 가상 네트워크 내에 사용자 지정 또는 고급 서브넷이 없는 경우 "기본값"을 선택합니다. 배포된 Voyage API 엔드포인트는 이 서브넷 내에 비공개 IP 주소 갖게 됩니다.

7

Review + create 탭 에서 구성을 검토 Create를 클릭하여 확인합니다. 그렇지 않으면 이전 버튼이나 해당 탭을 클릭하여 변경합니다.

8

Voyage API 엔드포인트 생성을 확인합니다. 생성되는 동안 '배포 진행 중' 상태가 표시됩니다.

9

Voyage API 엔드포인트가 성공적으로 생성되면 상태가 ' 배포서버 완료되었습니다'로 변경됩니다.

중요

애플리케이션 속성을 보려면 리소스 로 고 (Go) 클릭합니다.

10

애플리케이션 리소스 페이지의 설정 섹션에서 매개변수 및 출력을 클릭하여 엔드포인트의 비공개 IP 가져옵니다. 비공개 IP ('privateIPAddress' 출력)를 기록해 둡니다. 애플리케이션 엔드포인트를 호출하려면 이 IP 주소 필요합니다.

Azure Marketplace에서 Voyage API 엔드포인트를 배포하는 데 도움이 필요한 경우 MongoDB 지원 문의 .

배포가 완료되면 동일한 가상 네트워크 내의 모든 서비스에서 HTTP 요청을 통해 Voyage API 엔드포인트에 액세스할 수 있습니다.

Voyage API 엔드포인트에 액세스 방법을 보여 주기 위해 동일한 가상 네트워크 내에 Bastion 가상 머신을 생성해 보겠습니다. 모델 엔드포인트를 쿼리 위해 네트워크의 다른 기존 머신/서버를 사용하거나 사용하려는 경우 이 섹션을 건너뛰고 Invoke Voyage API Endpoint(Voyage API 엔드포인트 호출) 섹션으로 건너뛸 수 있습니다.

1

Azure Portal 홈에서 리소스 만들기 를 클릭합니다.

2

'가상 머신'을 검색합니다. 결과에서 가상 머신을 선택합니다.

3

이 절차는 데모 목적으로만 저비용 가상 머신 구성을 안내합니다. 고급 사용자인 경우 사용자 지정 구성을 만들 수 있습니다.

기본 사항 필드를 채웁니다. 완료되면 다음을 클릭합니다.

필드

서브스크립션

구독 선택합니다.

리소스 그룹

Voyage API 엔드포인트가 포함된 리소스 그룹 선택합니다.

가상 머신 이름

가상 머신의 이름을 입력합니다.

리전

Voyage API 엔드포인트의 리전 선택합니다.

가용성 옵션

'인프라 중복성 필요 없음'을 선택합니다.

보안 유형

'표준'을 선택합니다.

이미지

' Ubuntu Server 24.04 LTS - x64 Gen2'을 선택합니다.

VM 아키텍처

"x64"를 선택합니다.

Azure 스폿 할인으로 실행

확인란을 선택하지 않은 상태로 둡니다.

size

'Standard_B1- 1 vcpu, 1GiB 메모리'를 선택합니다.

최대 절전 모드 활성화

확인란을 선택하지 않은 상태로 둡니다.

인증 유형

'SSH 공개 키'를 선택합니다.

사용자 이름

"voyage"를 입력합니다.

SSH 공개 키 소스

'새 키 쌍 생성'을 선택합니다.

SSH 키 유형

"RSA SSH 형식"을 선택합니다.

키 쌍 이름

'vm-voyage_key'를 입력합니다.

공용 인바운드 포트

'선택한 포트 허용'을 선택합니다.

인바운드 포트 선택

'SSH(22)'를 선택합니다.

디스크 탭 필드를 채웁니다. 완료되면 다음을 클릭하여 네트워킹으로 이동합니다.

필드

호스팅하다 에서 암호화

확인란을 선택하지 않은 상태로 둡니다.

OS disk size

'이미지 기본값 (30 GiB)'을 선택합니다.

OS disk type

'표준 하드디스크(로컬 중복 저장)'를 선택합니다.

VM으로 삭제

확인란을 선택합니다.

키 관리

'플랫폼 관리형 키'를 선택합니다.

울트라 디스크 호환성 활성화

확인란을 선택하지 않은 상태로 둡니다.

네트워킹 탭 의 필드를 채웁니다. 완료되면 Review + create를 클릭합니다.

필드

가상 네트워크

중요. Voyage API 엔드포인트가 배포된 가상 네트워크를 선택합니다.

서브넷

중요. 가상 네트워크 내에서Voyage API 엔드포인트가 배포된 서브넷을 선택합니다.

공개 IP

중요. 새 공용 IP 만듭니다. 이를 생성하지 않으면 가상 네트워크 외부에서 가상 머신 액세스 할 수 없습니다.

NIC 네트워크 보안 그룹

'기본'을 선택합니다.

공용 인바운드 포트

'선택한 포트 허용'을 선택합니다.

인바운드 포트 선택

'SSH(22)'를 선택합니다.

VM 삭제 시 공용 IP 및 NIC 삭제

확인란을 선택하지 않은 상태로 둡니다.

가속화된 네트워킹 활성화

확인란을 선택하지 않은 상태로 둡니다.

로드 밸런싱 옵션

"없음"을 선택합니다.

1

Review + create 탭 에서 구성을 검토 Create를 클릭하여 확인합니다. 그렇지 않으면 이전 버튼이나 해당 탭을 클릭하여 변경합니다.

2

새로운 새 키 쌍 생성 모달이 나타납니다.Download private key and create 리소스 클릭하여 키를 로컬 머신에 저장합니다. 키를 저장한 위치를 확인합니다.

3

Bastion 가상 머신 생성을 확인합니다. 생성되는 동안 '배포 진행 중' 상태가 표시됩니다. Bastion 가상 머신이 성공적으로 생성되면 상태가 ' 배포서버 완료되었습니다'로 변경됩니다.고 (Go) to 리소스 로 이동)를 클릭하여 Bastion 가상 머신 공용 IP 주소 가져옵니다.

4

Bastion 가상 머신 페이지의 개요 섹션에 있는 필수 항목에서 공용 IP 주소 찾을 수 있습니다.

5

다운로드한 SSH 비공개 키의 권한을 읽기 전용으로 업데이트합니다.

chmod 400 vm-voyage_key.pem
6

비공개 키를 사용하여 Bastion 가상 머신 셸 (SSH)에 안전하게 로그인합니다. 형식은 ssh -i {private-ssh-key} voyage@{bastion-vm-public-ip-address}입니다. 예시: ssh -i vm-voyage_key.pem voyage@52.143.109.43.

1

다음 엔드포인트를 사용하여 Voyage API 연결할 수 있는지 확인합니다.

curl -X GET http://10.0.0.4/info
{"model":"voyage-4","model_loaded":true,"tokenizer_initialized":true,"loading_status":"completed","gpu_info":{"count":1,"memory_allocated_mb":XXX,"memory_reserved_mb": XXX}}
2

다음 엔드포인트를 사용하여 Voyage API 에 요청 수 있습니다: http://{voyage-app-vnet-private-ip}/embeddings.

curl -X GET "http://10.0.0.4/embeddings" \
-H "Content-Type: application/json" \
-d '{ "input": ["Best-in-class embedding models and rerankers"], "input_type": "query" }'
{"data":[{"object":"embedding","embedding":["-0.031104945",...,"-0.037366055"],"index":0}],"object":"list","model":"voyage-4-large","usage":{"total_tokens":13}}

모든 엔드포인트 매개변수는 API 참조를 참조하세요.

Voyage API 엔드포인트를 삭제 하려면 애플리케이션 으로 이동하여 Overview(개요) 섹션에서 Delete(삭제) 버튼을 클릭합니다. 표시되는 대화 상자에서 예를 클릭하여 삭제를 확인합니다. 이렇게 하면 연결된 managed 리소스 그룹 도 삭제됩니다.

Bastion 가상 머신을 프로비저닝한 경우 낭비되는 비용과 예기치 않은 요금이 발생하지 않도록 가상 머신을 삭제 .

1

Bastion 가상 머신으로 (Go) 개요 섹션에서 삭제 버튼을 클릭합니다. 삭제 패널이 나타납니다.

2

삭제 패널에서 아래 스크린샷에 표시된 모든 확인란을 선택하여 모든 가상 머신 리소스가 삭제되었는지 확인합니다: 강제 삭제 적용, OS 디스크, 네트워크인터페이스, 공용 IP 주소. "이 가상 머신과 위에 나열된 선택한 모든 관련 리소스가 삭제된다는 것을 읽었으며 이를 이해합니다."라는 확인 확인란을 선택합니다. 마지막으로 삭제를 클릭합니다.

돌아가기

AWS Marketplace

이 페이지의 내용