首頁>
2
回覆列表
  • 1 # 瞎聊聊閒逛逛

    在 Windows 操作系統中,可以使用 PowerShell 腳本批量提取多個 Word 文檔中的文字。具體步驟如下:

    1. 打開 Windows Powershell。在命令提示符中輸入 "powershell" 並按回車鍵啟動 PowerShell。

    2. 進入要保存提取文本的文件夾。可以通過 "cd" 命令進入到該文件夾。

    3. 輸入以下腳本來批量提取 Word 文檔中的文本:

    ```powershell

    $word = New-Object -ComObject Word.Application

    Get-ChildItem *.docx | foreach { $doc = $word.Documents.Open($_.FullName); $doc.Content.Text | Out-File $_.Name.Replace(".docx", ".txt"); $doc.Close() }

    $word.Quit()

    ```

    這個腳本會創建一個 Word 應用程序實例,循環遍歷當前目錄下的所有 .docx 文件,打開每個文檔並獲取其內容,將文本輸出到一個同名的.txt 文件中,並關閉文檔。

    4. 運行腳本。在 PowerShell 中執行該腳本。

    5. 完成後,在當前文件夾中會生成和 Word 文檔同名的 .txt 文件,其中包含對應 Word 文檔中的文本。

    需要注意的是,如果文檔中有一些圖片或表格等內容,這個腳本只會提取文本。如果需要提取更多的內容,需要對腳本進行修改。