株式会社オートプロジェクト

Columnコラム
  • TOP
  • コラム一覧
  • DeepL APIを使ってWordPressの記事を翻訳後にHTMLタグを正規表現で補完する方法
2023年12月18日
DeepL APIを使ってWordPressの記事を翻訳後にHTMLタグを正規表現で補完する方法

WordPressの記事をDeepLのAPIを使用して翻訳した際に、HTMLタグが正しく認識されず、翻訳後に閉じタグが「<h3」のように表記されてしまうという事例が発生したため、その対処法です。

HTMLタグが正しく認識されない場合の解決方法

以下のように正規表現を用いて閉じタグが不完全な部分を補完します。

preg_replace('#</([^>]*)(?![a-z0-9])(?!>)#', '</$1>', '[不完全なhtmlタグを含む文字列]');