dataset-creation.ts 11 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: 'ナレッジの作成',
  5. update: 'データの追加',
  6. },
  7. one: 'データソースの選択',
  8. two: 'テキストの前処理とクリーニング',
  9. three: '実行して完了',
  10. },
  11. error: {
  12. unavailable: 'このナレッジは利用できません',
  13. },
  14. firecrawl: {
  15. configFirecrawl: '🔥Firecrawlの設定',
  16. apiKeyPlaceholder: 'firecrawl.devからのAPIキー',
  17. getApiKeyLinkText: 'firecrawl.devからAPIキーを取得する',
  18. },
  19. stepOne: {
  20. filePreview: 'ファイルプレビュー',
  21. pagePreview: 'ページプレビュー',
  22. dataSourceType: {
  23. file: 'テキストファイルからインポート',
  24. notion: 'Notionから同期',
  25. web: 'ウェブサイトから同期',
  26. },
  27. uploader: {
  28. title: 'テキストファイルをアップロード',
  29. button: 'ファイルをドラッグ&ドロップするか',
  30. browse: '参照',
  31. tip: '{{supportTypes}}をサポートしています。1つあたりの最大サイズは{{size}}MBです。',
  32. validation: {
  33. typeError: 'サポートされていないファイルタイプです',
  34. size: 'ファイルサイズが大きすぎます。最大サイズは{{size}}MBです',
  35. count: '複数のファイルはサポートされていません',
  36. filesNumber: 'バッチアップロードの制限({{filesNumber}}個)に達しました。',
  37. },
  38. cancel: 'キャンセル',
  39. change: '変更',
  40. failed: 'アップロードに失敗しました',
  41. },
  42. notionSyncTitle: 'Notionが接続されていません',
  43. notionSyncTip: 'Notionと同期するには、まずNotionへの接続が必要です。',
  44. connect: '接続する',
  45. button: '次へ',
  46. emptyDatasetCreation: '空のナレッジを作成します',
  47. modal: {
  48. title: '空のナレッジを作成',
  49. tip: '空のナレッジにはドキュメントが含まれず、いつでもドキュメントをアップロードできます。',
  50. input: 'ナレッジ名',
  51. placeholder: '入力してください',
  52. nameNotEmpty: '名前は空にできません',
  53. nameLengthInvalid: '名前は1〜40文字である必要があります',
  54. cancelButton: 'キャンセル',
  55. confirmButton: '作成',
  56. failed: '作成に失敗しました',
  57. },
  58. website: {
  59. fireCrawlNotConfigured: 'Firecrawlが設定されていません',
  60. fireCrawlNotConfiguredDescription: 'Firecrawl を使用するには、Firecrawl の API キーを設定してください。',
  61. configure: '設定',
  62. run: '実行',
  63. firecrawlTitle: '🔥Firecrawlを使っでウエブコンテンツを抽出',
  64. firecrawlDoc: 'Firecrawlドキュメント',
  65. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  66. options: 'オプション',
  67. crawlSubPage: 'サブページをクロールする',
  68. limit: '制限',
  69. maxDepth: '最大深度',
  70. excludePaths: 'パスを除外する',
  71. includeOnlyPaths: 'パスのみを含める',
  72. extractOnlyMainContent: 'メインコンテンツのみを抽出する(ヘッダー、ナビ、フッターなどは抽出しない)',
  73. exceptionErrorTitle: 'Firecrawl ジョブの実行中に例外が発生しました:',
  74. unknownError: '不明なエラー',
  75. totalPageScraped: 'スクレイピングされた総ページ数:',
  76. selectAll: 'すべて選択',
  77. resetAll: 'すべてリセット',
  78. scrapTimeInfo: '{{time}} 秒以内に合計 {{total}} ページをスクレイピングしました',
  79. preview: 'プレビュー',
  80. maxDepthTooltip: '入力されたURLを基にしたクローリング作業での設定可能な最大深度について説明します。深度0は入力されたURL自体のページを対象としたスクレイピングを意味します。深度1では、元のURLの直下にあるページ(URLに続く最初の"/"以降の内容)もスクレイピングの対象になります。この深度は指定した数値まで増加させることができ、それに応じてスクレイピングの範囲も広がっていきます。',
  81. jinaReaderDocLink: 'https://jina.ai/reader',
  82. useSitemap: 'サイトマップを使用する',
  83. jinaReaderNotConfigured: 'Jina Reader が設定されていません',
  84. jinaReaderDoc: 'Jina Readerの詳細',
  85. jinaReaderTitle: 'サイト全体をMarkdownに変換する',
  86. chooseProvider: 'プロバイダーを選択する',
  87. jinaReaderNotConfiguredDescription: '無料のAPIキーを入力してJina Readerを設定します。',
  88. useSitemapTooltip: 'サイトマップに沿ってサイトをクロールします。そうでない場合、Jina Readerはページの関連性に基づいて繰り返しクロールし、ページ数は少なくなりますが、高品質のページが得られます。',
  89. },
  90. },
  91. stepTwo: {
  92. segmentation: 'チャンク設定',
  93. auto: '自動',
  94. autoDescription: 'チャンクと前処理ルールを自動的に設定します。初めてのユーザーはこれを選択することをおすすめします。',
  95. custom: 'カスタム',
  96. customDescription: 'チャンクのルール、チャンクの長さ、前処理ルールなどをカスタマイズします。',
  97. separator: 'セグメント識別子',
  98. separatorPlaceholder: '例えば改行(\\\\n)や特殊なセパレータ(例:「***」)',
  99. maxLength: '最大チャンク長',
  100. overlap: 'チャンクのオーバーラップ',
  101. overlapTip: 'チャンクのオーバーラップを設定することで、それらの間の意味的な関連性を維持し、検索効果を向上させることができます。最大チャンクサイズの10%〜25%を設定することをおすすめします。',
  102. overlapCheck: 'チャンクのオーバーラップは最大チャンク長を超えてはいけません',
  103. rules: 'テキストの前処理ルール',
  104. removeExtraSpaces: '連続するスペース、改行、タブを置換する',
  105. removeUrlEmails: 'すべてのURLとメールアドレスを削除する',
  106. removeStopwords: '「a」「an」「the」などのストップワードを削除する',
  107. preview: '確認&プレビュー',
  108. reset: 'リセット',
  109. indexMode: 'インデックスモード',
  110. qualified: '高品質',
  111. recommend: 'おすすめ',
  112. qualifiedTip: 'ユーザーのクエリに対してより高い精度を提供するために、デフォルトのシステム埋め込みインターフェースを呼び出して処理します。',
  113. warning: 'モデルプロバイダのAPIキーを設定してください。',
  114. click: '設定に移動',
  115. economical: '経済的',
  116. economicalTip: 'オフラインのベクトルエンジン、キーワードインデックスなどを使用して、トークンを消費せずに精度を低下させます。',
  117. QATitle: '質問と回答形式でセグメント化',
  118. QATip: 'このオプションを有効にすると、追加のトークンが消費されます',
  119. QALanguage: '使用言語',
  120. estimateCost: '見積もり',
  121. estimateSegment: '推定チャンク数',
  122. segmentCount: 'チャンク',
  123. calculating: '計算中...',
  124. fileSource: 'ドキュメントの前処理',
  125. notionSource: 'ページの前処理',
  126. websiteSource: 'ウエブサイドの前処理',
  127. other: 'その他',
  128. fileUnit: 'ファイル',
  129. notionUnit: 'ページ',
  130. webpageUnit: ' ページ',
  131. previousStep: '前のステップ',
  132. nextStep: '保存して処理',
  133. save: '保存して処理',
  134. cancel: 'キャンセル',
  135. sideTipTitle: 'なぜチャンクと前処理が必要なのか',
  136. sideTipP1: 'テキストデータを処理する際、チャンクとクリーニングは2つの重要な前処理ステップです。',
  137. sideTipP2: 'セグメンテーションは長いテキストを段落に分割し、モデルがより理解しやすくします。これにより、モデルの結果の品質と関連性が向上します。',
  138. sideTipP3: 'クリーニングは不要な文字や書式を削除し、ナレッジをよりクリーンで解析しやすいものにします。',
  139. sideTipP4: '適切なチャンクとクリーニングはモデルのパフォーマンスを向上させ、より正確で価値のある結果を提供します。',
  140. previewTitle: 'プレビュー',
  141. previewTitleButton: 'プレビュー',
  142. previewButton: 'Q&A形式に切り替える',
  143. previewSwitchTipStart: '現在のチャンクプレビューはテキスト形式です。質問と回答形式のプレビューに切り替えると、',
  144. previewSwitchTipEnd: ' 追加のトークンが消費されます',
  145. characters: '文字',
  146. indexSettingTip: 'インデックス方法を変更するには、',
  147. retrievalSettingTip: '検索方法を変更するには、',
  148. datasetSettingLink: 'ナレッジ設定',
  149. separatorTip: '区切り文字は、テキストを区切るために使用される文字です。\\n\\n と \\n は、段落と行を区切るために一般的に使用される区切り記号です。カンマ (\\n\\n,\\n) と組み合わせると、最大チャンク長を超えると、段落は行で区切られます。自分で定義した特別な区切り文字を使用することもできます(例:***)。',
  150. maxLengthCheck: 'チャンクの最大長は {{limit}} 未満にする必要があります',
  151. },
  152. stepThree: {
  153. creationTitle: '🎉 ナレッジが作成されました',
  154. creationContent: 'ナレッジの名前は自動的に設定されましたが、いつでも変更できます',
  155. label: 'ナレッジ名',
  156. additionTitle: '🎉 ドキュメントがアップロードされました',
  157. additionP1: 'ドキュメントはナレッジにアップロードされました',
  158. additionP2: '、ナレッジのドキュメントリストで見つけることができます。',
  159. stop: '処理を停止',
  160. resume: '処理を再開',
  161. navTo: 'ドキュメントに移動',
  162. sideTipTitle: '次は何ですか',
  163. sideTipContent: 'ドキュメントのインデックスが完了したら、ナレッジをアプリケーションのコンテキストとして統合することができます。プロンプトオーケストレーションページでコンテキスト設定を見つけることができます。また、独立したChatGPTインデックスプラグインとしてリリースすることもできます。',
  164. modelTitle: '埋め込みを停止してもよろしいですか?',
  165. modelContent: '後で処理を再開する必要がある場合は、中断した場所から続行します。',
  166. modelButtonConfirm: '確認',
  167. modelButtonCancel: 'キャンセル',
  168. },
  169. jinaReader: {
  170. getApiKeyLinkText: '無料のAPIキーを jina.ai で取得',
  171. apiKeyPlaceholder: 'jina.ai からの API キー',
  172. configJinaReader: 'Jina Readerの設定',
  173. },
  174. }
  175. export default translation