📄 ai-sdk/docs/reference/ai-sdk-core/generate-speech

File: generate-speech.md | Updated: 11/15/2025

Source: https://ai-sdk.dev/docs/reference/ai-sdk-core/generate-speech

Menu

v5 (Latest)

AI SDK 5.x

AI SDK by Vercel

Providers and Models

Getting Started

Navigating the Library

Next.js App Router

Next.js Pages Router

Building Agents

Workflow Patterns

Generating Text

Generating Structured Data

Model Context Protocol (MCP) Tools

Prompt Engineering

Image Generation

Language Model Middleware

Provider & Model Management

Chatbot Message Persistence

Chatbot Resume Streams

Chatbot Tool Usage

Generative User Interfaces

Object Generation

Streaming Custom Data

Reading UIMessage Streams

Message Metadata

Stream Protocols

experimental_createMCPClient

Experimental_StdioMCPTransport

validateUIMessages

safeValidateUIMessages

createProviderRegistry

cosineSimilarity

wrapLanguageModel

LanguageModelV2Middleware

extractReasoningMiddleware

simulateStreamingMiddleware

defaultSettingsMiddleware

simulateReadableStream

createIdGenerator

Migration Guides

Troubleshooting

Copy markdown

generateSpeech()

===================================================================================================

generateSpeech is an experimental feature.

Generates speech audio from text.

import { experimental_generateSpeech as generateSpeech } from 'ai';import { openai } from '@ai-sdk/openai';
const { audio } = await generateSpeech({  model: openai.speech('tts-1'),  text: 'Hello from the AI SDK!',  voice: 'alloy',});
console.log(audio);

OpenAI

import { experimental_generateSpeech as generateSpeech } from 'ai';import { openai } from '@ai-sdk/openai';
const { audio } = await generateSpeech({  model: openai.speech('tts-1'),  text: 'Hello from the AI SDK!',  voice: 'alloy',});

ElevenLabs

import { experimental_generateSpeech as generateSpeech } from 'ai';import { elevenlabs } from '@ai-sdk/elevenlabs';
const { audio } = await generateSpeech({  model: elevenlabs.speech('eleven_multilingual_v2'),  text: 'Hello from the AI SDK!',  voice: 'your-voice-id', // Required: get this from your ElevenLabs account});

import { experimental_generateSpeech as generateSpeech } from "ai"

Parameters

model:

SpeechModelV2

The speech model to use.

text:

string

The text to generate the speech from.

voice?:

string

The voice to use for the speech.

outputFormat?:

string

The output format to use for the speech e.g. "mp3", "wav", etc.

instructions?:

string

Instructions for the speech generation.

speed?:

number

The speed of the speech generation.

language?:

string

The language for speech generation. This should be an ISO 639-1 language code (e.g. "en", "es", "fr") or "auto" for automatic language detection. Provider support varies.

providerOptions?:

Record<string, Record<string, JSONValue>>

Additional provider-specific options.

maxRetries?:

number

Maximum number of retries. Default: 2.

abortSignal?:

AbortSignal

An optional abort signal to cancel the call.

headers?:

Record<string, string>

Additional HTTP headers for the request.

Returns

audio:

GeneratedAudioFile

The generated audio.

GeneratedAudioFile

base64:

string

Audio as a base64 encoded string.

uint8Array:

Uint8Array

Audio as a Uint8Array.

mimeType:

string

MIME type of the audio (e.g. "audio/mpeg").

format:

string

Format of the audio (e.g. "mp3").

warnings:

SpeechWarning[]

Warnings from the model provider (e.g. unsupported settings).

responses:

Array<SpeechModelResponseMetadata>

Response metadata from the provider. There may be multiple responses if we made multiple calls to the model.

SpeechModelResponseMetadata

timestamp:

Date

Timestamp for the start of the generated response.

modelId:

string

The ID of the response model that was used to generate the response.

body?:

unknown

Optional response body.

headers?:

Record<string, string>

Response headers.

On this page

generateSpeech()

Deploy and Scale AI Apps with Vercel.

Vercel delivers the infrastructure and developer experience you need to ship reliable AI-powered applications at scale.

Trusted by industry leaders:

OpenAI
Photoroom

Talk to an expert