過去Amazon Comprehend只能處理純文字dangan，而現(xiàn)在還能處理Word和PDF文件dangan，以及筆記或是列表等數(shù)據(jù)內(nèi)容。

　　AWS更新自然語言處理服務(wù)Amazon Comprehend，開始支援Word和PDF文件，讓用戶可以從這些類型的dangan擷取數(shù)據(jù)。Amazon Comprehend能夠分析不同語言的文字，並且辨識這些文字的內(nèi)容，諸如人名、地點、品牌和產(chǎn)品等，同時還能理解文本中的關(guān)鍵句子和情緒，或?qū)Υ罅课募膬?nèi)容，依照主題加以分類。

　　無論是開設(shè)銀行帳戶、申請保險或是房屋借款等程序，皆大量使用紙本文件，而這些文件動則超過百頁，對於企業(yè)來說，手動處理這些文件是一件繁瑣的工作，不只需要人工，而且速度緩慢容易出錯，而藉由使用Amazon Comprehend，可以大幅加速文件的創(chuàng)建和管理，並且降低出錯機率。

　　Amazon Comprehend新的解決方案，可處理PDF、Word和原始文字等dangan格式，或是筆記和列表等布局，並進行內(nèi)容擷取和分析，AWS提到，這次推出的解決方案，結(jié)合自然語言處理和光學(xué)字元辨識技術(shù)，能夠減少企業(yè)文件的預(yù)處理和後處理工作量，用戶不再需要將dangan轉(zhuǎn)換成原始文本，就能夠使用自定義命名實際辨識（NER）功能。

　　過去Amazon Comprehend只能處理純文字dangan，這需要用戶先將文件整理成機器可讀的文本，但用戶現(xiàn)在能夠利用Amazon Comprehend以相同的API，直接從PDF和Word中的文字或是列表等不同文件布局，擷取特定詞語。

　　新的Amazon Comprehend自定義實體辨識模型，綜合分析結(jié)構(gòu)上下文和自然語言上下文，從文件中的任何位置，擷取自定義實體。AWS提到，用戶對于每一種實體類型，只要提供250個文件和100個注解，即可訓(xùn)練模型並且開始使用該功能，而為了要掃描PDF並擷取空間位置，Amazon Comprehen。d會呼叫Amazon Textract服務(wù)，來執(zhí)行必要的處理。

　　這項新功能有助於企業(yè)處理保險、抵押、金融等業(yè)務(wù)中的文件處理工作流程，通常這些文件布局復(fù)雜，用戶也不需要頁面上的每一個數(shù)據(jù)點，因此擷取特定資訊存在困難，而Amazon Comprehend這項新功能，可以使用機器學(xué)習(xí)，使用單個模型和API呼叫，快速擷取自定義的詞語，像是處理汽車或健康保險文件中的索賠金額，甚至是在抵押貸款中，擷取申請人姓名、共同簽署人或是其他財務(wù)文件資訊等

亚洲精品网站在线观看不卡无广告,国产a不卡片精品免费观看,欧美亚洲一区二区三区在线,国产一区二区三区日韩,日本久久久久,日本-区二区三区免费精品,中文字幕日本亚洲欧美不卡

自然語言處理服務(wù)Amazon Comprehend現(xiàn)支援Word和PDF文件格式

評論排行

推薦閱讀

專題

大家都在看

CTI論壇會員企業(yè)