文档解析服务

我们的文档解析服务利用 claude-3-7-sonnet-latest, deepseek-r1 等先进模型,通过 XAI XAPI 从多种格式的文档中提取和分析内容。该服务可以处理单个或多个文档,并根据用户的查询提供相关信息。

支持的文件格式

我们支持解析以下7种文档格式:

  • PDF (.pdf)
  • 文本文件 (.txt, .sh, .py, .js, 等)
  • Word 文档 (.doc, .docx)
  • Excel 电子表格 (.xls, .xlsx)
  • CSV 文件 (.csv)
  • Markdown 文件 (.md, .markdown)
  • HTML 文件 (.html, .htm)

使用限制

  • 单个 PDF 文件大小不得超过 4.5MB。
  • 每次对话最多处理 5 个文件。

API 端点

我们的服务提供两个主要的 API 端点,分别兼容 Anthropic 和 OpenAI 的格式:

  1. https://api.xaixapi.com/v1/messages (Anthropic 格式)
  2. https://api.xaixapi.com/v1/chat/completions (OpenAI 格式)

使用示例

以下是使用我们的文档解析服务的几个示例:

示例 1: 处理单个文档 (Anthropic 格式)

使用 /v1/messages 端点处理单个文档:

API_KEY="YOUR_XAI_API_KEY"

curl https://api.xaixapi.com/v1/messages \
   -H "content-type: application/json" \
   -H "x-api-key: $API_KEY" \
   -H "anthropic-version: 2023-06-01" \
   -d '{
     "model": "claude-3-7-sonnet-latest",
     "max_tokens": 1024,
     "messages": [{
         "role": "user",
         "content": [{
             "type": "document",
             "source": {
                 "type": "url",
                 "url": "https://cfbed.1314883.xyz/file/1744972227336_test-1.pdf"
             }
         },
         {
             "type": "text",
             "text": "从这份文档中提取关键信息。"
         }]
     }]
 }'

示例 2: 处理单个文档 (OpenAI 格式)

使用 /v1/chat/completions 端点处理单个文档:

API_KEY="YOUR_XAI_API_KEY"

curl -X POST "https://api.xaixapi.com/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $API_KEY" \
  -d '{
    "model": "claude-3-7-sonnet-latest",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "url",
              "url": "https://cfbed.1314883.xyz/file/1744972223519_test.docx"
            }
          },
          {
            "type": "text",
             "text": "总结这份文档的主要内容。"
          }
        ]
      }
    ],
    "max_tokens": 1000
  }'

示例 3: 处理多个文档

使用 /v1/chat/completions 端点处理多个文档(最多5个):

API_KEY="YOUR_XAI_API_KEY"

curl -X POST "https://api.xaixapi.com/v1/chat/completions" \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $API_KEY" \
  -d '{
    "model": "claude-3-7-sonnet-latest",
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "url",
              "url": "https://cfbed.1314883.xyz/file/1744972223519_test.xlsx"
            }
          },
          {
            "type": "document",
            "source": {
              "type": "url",
              "url": "https://cfbed.1314883.xyz/file/1744972227336_test.pdf"
            }
          },
          {
            "type": "text",
             "text": "比较这两份文档的数据差异。"
          }
        ]
      }
    ],
    "max_tokens": 1000
  }'
请确保所有文档都符合大小限制,并且每次请求的文件数量不超过5个。