从 API 版本
2019-05-06
开始,将会构建项级索引器错误和警告,使原因和后续措施变得更明朗。 这些信息包含以下属性:
受错误或警告影响的文档的文档 ID。
https://<storageaccount>.blob.core.windows.net/jfk-1k/docid-32112954.pdf
操作名称,描述发生错误或警告的位置。 这由以下结构生成:
[category]
.
[subcategory]
.
[resourceType]
.
[resourceName]
DocumentExtraction.azureblob.myBlobContainerName
Enrichment.WebApiSkill.mySkillName
Projection.SearchIndex.OutputFieldMapping.myOutputFieldName
Projection.SearchIndex.MergeOrUpload.myIndexName
Projection.KnowledgeStore.Table.myTableName
Message
错误或警告的概要说明。
Could not execute skill because the Web Api request failed.
可能有助于诊断问题的具体信息,例如,执行自定义技能失败时的 Web API 响应。
link-cryptonyms-list - Error processing the request record : System.ArgumentNullException: Value cannot be null. Parameter name: source at System.Linq.Enumerable.All[TSource](IEnumerable 1 source, Func 2 predicate) at Microsoft.CognitiveSearch.WebApiSkills.JfkWebApiSkills. ...rest of stack trace...
DocumentationLink
相关文档的链接,该文档包含用于调试和解决问题的详细信息。 此链接通常指向本页的以下部分之一。
https://go.microsoft.com/fwlink/?linkid=2106475
不同文档中的字段类型不一致
Type of value has a mismatch with column type. Couldn't store '{47.6,-122.1}' in authors column. Expected type is JArray.
Error converting data type nvarchar to float.
Conversion failed when converting the nvarchar value '12 months' to data type int.
Arithmetic overflow error converting expression to data type int.
确保不同文档中每个字段的类型相同。 例如,如果第一个文档的
'startTime'
字段是日期时间,而在第二个文档中,该字段是字符串,则就会出现此错误。
数据源的底层服务发生的错误
从 Azure Cosmos DB:
{"Errors":["Request rate is large"]}
检查存储实例,确保其正常运行。 可能需要调整缩放或分区。
暂时性问题
A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host
偶尔出现意外的连接问题。 稍后再次尝试通过索引器运行文档。
Blob 超过大小限制
Document is '150441598' bytes, which exceeds the maximum size '134217728' bytes for document extraction for your current service tier.
Blob 索引错误
Blob 采用了不受支持的内容类型
Document has unsupported content type 'image/png'
Blob 索引错误
Blob 已加密
Document could not be processed - it may be encrypted or password protected.
可以使用
Blob 设置
跳过 Blob。
暂时性问题
Error processing blob: The request was aborted: The request was canceled.
Document timed out during processing.
偶尔出现意外的连接问题。 稍后再次尝试通过索引器运行文档。
缺少文档键
Document key cannot be missing or empty
确保所有文档具有有效的文档键。 文档键是通过将“键”属性设置为
索引定义
的一部分来确定的。 当在特定文档上找不到标记为“键”的属性时,索引器会发出此错误。
文档键无效
Invalid document key. Keys can only contain letters, digits, underscore (_), dash (-), or equal sign (=).
确保所有文档具有有效的文档键。 有关更多详细信息,请查看
为 Blob 存储编制索引
。 如果使用 Blob 索引器,并且文档键为
metadata_storage_path
字段,请确保索引器定义具有
base64Encode 映射函数
,其中
parameters
等于
null
,而不是纯文本格式的路径。
文档键无效
Document key cannot be longer than 1024 characters
根据验证要求修改文档键。
无法将字段映射应用到某个字段
Could not apply mapping function 'functionName' to field 'fieldName'. Array cannot be null. Parameter name: bytes
请反复检查索引器中定义的
字段映射
,并与失败文档的指定字段的数据进行比较。 可能需要修改字段映射或文档数据。
无法读取字段值
Could not read the value of column 'fieldName' at index 'fieldIndex'. A transport-level error has occurred when receiving results from the server. (provider: TCP Provider, error: 0 - An existing connection was forcibly closed by the remote host.)
这些错误的常见原因是数据源的底层服务出现了意外的连接问题。 稍后再次尝试通过索引器运行文档。
Error: Could not map output field 'xyz' to search index due to deserialization problem while applying mapping function 'abc'
Error: Could not 'MergeOrUpload' | 'Delete' document to the search index
已读取并处理文档,但索引器无法将其添加到搜索索引。 此错误的可能原因包括:
Reason
详细信息/示例
文档的集合中包含太多的对象
文档中的某个集合超过了
所有复杂集合的最大元素数目限制
。
The document with key '1000052' has '4303' objects in collections (JSON arrays). At most '3000' objects are allowed to be in collections across the entire document. Remove objects from collections and try indexing the document again.
我们建议将文档中复杂集合的大小减至限制以下,并避免较高的存储利用率。
由于服务正在承受其他负载(例如查询或索引编制),连接到目标索引时出现问题(重试后仍会出现)。
未能建立连接,因此无法更新索引。 搜索服务的负载过重。
扩展搜索服务
搜索服务正在根据服务更新进行修补,或者处于拓扑重新配置过程的中途。
未能建立连接,因此无法更新索引。 搜索服务当前已关闭/搜索服务正在过渡。
根据
SLA 文档
,为服务至少配置三个可用性为 99.9% 的副本
底层计算/网络资源发生故障(罕见情况)
未能建立连接,因此无法更新索引。 发生未知的失败。
将索引器配置为
按计划运行
,以从失败状态继续工作。
由于出现网络问题,在超时期限内未确认对目标索引发出的索引编制请求。
无法及时与搜索索引建立连接。
将索引器配置为
按计划运行
,以从失败状态继续工作。 此外,如果此错误持续出现,请尝试减小索引器的
批大小
。
索引器提取的一项或多项字段的数据类型与相应目标索引字段的数据模型不兼容。
The data field '_data_' in the document with key '888' has an invalid value 'of type 'Edm.String''. The expected type was 'Collection(Edm.String)'.
未能从字符串值中提取任何 JSON 实体。
Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON object.
Error:'After parsing a value an unexpected character was encountered: ''. Path '_path_', line 1, position 3162.'
未能从字符串值中提取 JSON 实体的集合。
Could not parse value 'of type 'Edm.String'' of field '_data_' as a JSON array.
Error:'After parsing a value an unexpected character was encountered: ''. Path '[0]', line 1, position 27.'
在源文档中发现了未知类型。
Unknown type '_unknown_' cannot be indexed
源文档中对地理位置点使用了不兼容的表示法。
WKT POINT string literals are not supported. Use GeoJson point literals instead