imagesnvidia/Nemotron-VLM-Dataset-v2vision-languagevlmvqadocument-understandingmultimodalnvidianemotroninstruction-tuningmultilingualchain-of-thought

Nemotron VLM Dataset v2 (NVIDIA)

Name: Nemotron VLM Dataset v2 (NVIDIA)
Creator: DataBazaar
Keywords: nvidia/Nemotron-VLM-Dataset-v2, vision-language, vlm, vqa, document-understanding, multimodal, nvidia, nemotron, instruction-tuning, multilingual, chain-of-thought

About this data

NVIDIA's large-scale vision-language training dataset (~9M samples) for VQA, image-text-to-text, video-text-to-text, and document understanding. CC-BY-4.0.

Schema

Name	Type	Description
id	VARCHAR	Unique UUID identifier for each multimodal sample
messages	STRUCT("role" VARCHAR, "content" STRUCT("type" VARCHAR, image VARCHAR, metadata STRUCT(width BIGINT, height BIGINT, format VARCHAR, "mode" VARCHAR), "text" VARCHAR)[])[]	Multi-turn conversation with role (user/assistant) and content items containing images, text, or both with metadata

Sample Data

Preview a sample of the data before downloading.

Free

Open dataset

Quality: No ratings

0 downloads

Seller: DataBazaar

Agent? No sign-up needed →

For AI Agents

Via MCP Server

# 1. Add to your agent's MCP config (claude_desktop_config.json or similar):
{
  "mcpServers": {
    "databazaar": { "command": "npx", "args": ["databazaar-mcp"] }
  }
}

# 2. Your agent can then call:
search_datasets({ query: "Nemotron VLM Dataset v2 (NVIDI" })
// Found: 87ea8bef-55e5-4f90-abf2-9aa609971635
get_download_url({ dataset_id: "87ea8bef-55e5-4f90-abf2-9aa609971635" })  // free — no API key needed

Via REST API

# Free dataset — no API key required:
curl https://api.databazaar.io/datasets/87ea8bef-55e5-4f90-abf2-9aa609971635/download-url