dataset-creation.ts 8.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176
  1. const translation = {
  2. steps: {
  3. header: {
  4. creation: '建立知識庫',
  5. update: '上傳檔案',
  6. },
  7. one: '選擇資料來源',
  8. two: '文字分段與清洗',
  9. three: '處理並完成',
  10. },
  11. error: {
  12. unavailable: '該知識庫不可用',
  13. },
  14. stepOne: {
  15. filePreview: '檔案預覽',
  16. pagePreview: '頁面預覽',
  17. dataSourceType: {
  18. file: '匯入已有文字',
  19. notion: '同步自 Notion 內容',
  20. web: '同步自 Web 站點',
  21. },
  22. uploader: {
  23. title: '上傳文字檔案',
  24. button: '拖拽檔案至此,或者',
  25. browse: '選擇檔案',
  26. tip: '已支援 {{supportTypes}},每個檔案不超過 {{size}}MB。',
  27. validation: {
  28. typeError: '檔案型別不支援',
  29. size: '檔案太大了,不能超過 {{size}}MB',
  30. count: '暫不支援多個檔案',
  31. filesNumber: '批次上傳限制 {{filesNumber}}。',
  32. },
  33. cancel: '取消',
  34. change: '更改檔案',
  35. failed: '上傳失敗',
  36. },
  37. notionSyncTitle: 'Notion 未繫結',
  38. notionSyncTip: '同步 Notion 內容前,須先繫結 Notion 空間',
  39. connect: '去繫結',
  40. button: '下一步',
  41. emptyDatasetCreation: '建立一個空知識庫',
  42. modal: {
  43. title: '建立空知識庫',
  44. tip: '空知識庫中還沒有文件,你可以在今後任何時候上傳文件至該知識庫。',
  45. input: '知識庫名稱',
  46. placeholder: '請輸入知識庫名稱',
  47. nameNotEmpty: '名稱不能為空',
  48. nameLengthInvalid: '名稱長度不能超過 40 個字元',
  49. cancelButton: '取消',
  50. confirmButton: '建立',
  51. failed: '建立失敗',
  52. },
  53. website: {
  54. maxDepth: '最大深度',
  55. selectAll: '全選',
  56. exceptionErrorTitle: '運行 Firecrawl 作業時發生異常:',
  57. run: '跑',
  58. extractOnlyMainContent: '僅提取主要內容(無頁眉、導航、頁腳等)',
  59. fireCrawlNotConfiguredDescription: '使用 API 金鑰配置 Firecrawl 以使用它。',
  60. limit: '限制',
  61. crawlSubPage: '抓取子頁面',
  62. firecrawlDocLink: 'https://docs.dify.ai/guides/knowledge-base/sync-from-website',
  63. preview: '預覽',
  64. configure: '配置',
  65. excludePaths: '排除路徑',
  66. options: '選項',
  67. firecrawlDoc: 'Firecrawl 文件',
  68. totalPageScraped: '抓取的總頁數:',
  69. firecrawlTitle: '使用 🔥Firecrawl 提取 Web 內容',
  70. includeOnlyPaths: '僅包含路徑',
  71. resetAll: '全部重置',
  72. scrapTimeInfo: '在 {{time}} 秒內總共抓取了 {{total}} 個頁面',
  73. unknownError: '未知錯誤',
  74. fireCrawlNotConfigured: '未配置 Firecrawl',
  75. maxDepthTooltip: '相對於輸入的 URL 的最大爬網深度。深度 0 只是抓取輸入的 url 的頁面,深度 1 抓取 url 以及 enteredURL + 1 / 之後的所有內容,依此類推。',
  76. jinaReaderNotConfigured: '未配置 Jina Reader',
  77. jinaReaderNotConfiguredDescription: '通過輸入您的免費 API 金鑰進行訪問來設置 Jina Reader。',
  78. chooseProvider: '選擇供應商',
  79. jinaReaderDoc: '了解有關 Jina Reader 的更多資訊',
  80. jinaReaderTitle: '將整個網站轉換為 Markdown',
  81. useSitemap: '使用網站地圖',
  82. jinaReaderDocLink: 'https://jina.ai/reader',
  83. useSitemapTooltip: '按照網站地圖對網站進行爬網。否則,Jina Reader 將根據頁面相關性反覆運算抓取,從而生成更少但品質更高的頁面。',
  84. },
  85. },
  86. stepTwo: {
  87. segmentation: '分段設定',
  88. auto: '自動分段與清洗',
  89. autoDescription: '自動設定分段規則與預處理規則,如果不瞭解這些引數建議選擇此項',
  90. custom: '自定義',
  91. customDescription: '自定義分段規則、分段長度以及預處理規則等引數',
  92. separator: '分段識別符號',
  93. separatorPlaceholder: '例如換行符(\n)或特定的分隔符(如 "***")',
  94. maxLength: '分段最大長度',
  95. overlap: '分段重疊長度',
  96. overlapTip: '設定分段之間的重疊長度可以保留分段之間的語義關係,提升召回效果。建議設定為最大分段長度的10%-25%',
  97. overlapCheck: '分段重疊長度不能大於分段最大長度',
  98. rules: '文字預處理規則',
  99. removeExtraSpaces: '替換掉連續的空格、換行符和製表符',
  100. removeUrlEmails: '刪除所有 URL 和電子郵件地址',
  101. removeStopwords: '去除停用詞,例如 “a”,“an”,“the” 等',
  102. preview: '確認並預覽',
  103. reset: '重置',
  104. indexMode: '索引方式',
  105. qualified: '高質量',
  106. recommend: '推薦',
  107. qualifiedTip: '呼叫系統預設的嵌入介面進行處理,以在使用者查詢時提供更高的準確度',
  108. warning: '請先完成模型供應商的 API KEY 設定。.',
  109. click: '前往設定',
  110. economical: '經濟',
  111. economicalTip: '使用離線的向量引擎、關鍵詞索引等方式,降低了準確度但無需花費 Token',
  112. QATitle: '採用 Q&A 分段模式',
  113. QATip: '開啟後將會消耗額外的 token',
  114. QALanguage: '分段使用',
  115. estimateCost: '執行嵌入預估消耗',
  116. estimateSegment: '預估分段數',
  117. segmentCount: '段',
  118. calculating: '計算中...',
  119. fileSource: '預處理文件',
  120. notionSource: '預處理頁面',
  121. other: '和其他 ',
  122. fileUnit: ' 個檔案',
  123. notionUnit: ' 個頁面',
  124. previousStep: '上一步',
  125. nextStep: '儲存並處理',
  126. save: '儲存並處理',
  127. cancel: '取消',
  128. sideTipTitle: '為什麼要分段和預處理?',
  129. sideTipP1: '在處理文字資料時,分段和清洗是兩個重要的預處理步驟。',
  130. sideTipP2: '分段的目的是將長文字拆分成較小的段落,以便模型更有效地處理和理解。這有助於提高模型生成的結果的質量和相關性。',
  131. sideTipP3: '清洗則是對文字進行預處理,刪除不必要的字元、符號或格式,使知識庫更加乾淨、整潔,便於模型解析。',
  132. sideTipP4: '透過對知識庫進行適當的分段和清洗,可以提高模型在實際應用中的表現,從而為使用者提供更準確、更有價值的結果。',
  133. previewTitle: '分段預覽',
  134. previewTitleButton: '預覽',
  135. previewButton: '切換至 Q&A 形式',
  136. previewSwitchTipStart: '當前分段預覽是文字模式,切換到 Q&A 模式將會',
  137. previewSwitchTipEnd: '消耗額外的 token',
  138. characters: '字元',
  139. indexSettingTip: '要更改索引方法,請轉到',
  140. retrievalSettingTip: '要更改檢索方法,請轉到',
  141. datasetSettingLink: '知識庫設定。',
  142. websiteSource: '預處理網站',
  143. webpageUnit: '頁面',
  144. separatorTip: '分隔符是用於分隔文字的字元。\\n\\n 和 \\n 是分隔段落和行的常用分隔符。與逗號 (\\n\\n,\\n) 組合使用時,當超過最大區塊長度時,段落將按行分段。您也可以使用自定義的特殊分隔符(例如 ***)。',
  145. maxLengthCheck: '塊最大長度應小於 {{limit}}',
  146. },
  147. stepThree: {
  148. creationTitle: '🎉 知識庫已建立',
  149. creationContent: '我們自動為該知識庫起了個名稱,您也可以隨時修改',
  150. label: '知識庫名稱',
  151. additionTitle: '🎉 文件已上傳',
  152. additionP1: '文件已上傳至知識庫:',
  153. additionP2: ',你可以在知識庫的文件列表中找到它。',
  154. stop: '停止處理',
  155. resume: '恢復處理',
  156. navTo: '前往文件',
  157. sideTipTitle: '接下來做什麼',
  158. sideTipContent: '當文件完成索引處理後,知識庫即可整合至應用內作為上下文使用,你可以在提示詞編排頁找到上下文設定。你也可以建立成可獨立使用的 ChatGPT 索引外掛釋出。',
  159. modelTitle: '確認停止索引過程嗎?',
  160. modelContent: '如果您需要稍後恢復處理,則從停止處繼續。',
  161. modelButtonConfirm: '確認停止',
  162. modelButtonCancel: '取消',
  163. },
  164. firecrawl: {
  165. configFirecrawl: '配置 🔥Firecrawl',
  166. apiKeyPlaceholder: '來自 firecrawl.dev 的 API 金鑰',
  167. getApiKeyLinkText: '從 firecrawl.dev 獲取 API 金鑰',
  168. },
  169. jinaReader: {
  170. configJinaReader: '配置 Jina Reader',
  171. getApiKeyLinkText: '在 jina.ai 獲取您的免費 API 金鑰',
  172. apiKeyPlaceholder: '來自 jina.ai 的 API 金鑰',
  173. },
  174. }
  175. export default translation