โปรแกรมหน่วยความจำคำแปล แนวคิดและการนำไปใช้ของระบบหน่วยความจำการแปล การดาวน์โหลดหรืออัพโหลดหน่วยความจำคำแปล

วี.เอ็น. กราบอฟสกี้; วารสารนักแปลฝึกหัด "BRIDGES" 2/2547

บทความนี้พูดถึงเครื่องมือแปลใหม่ - เทคโนโลยี Translation Memory (TM) ซึ่งต้องขอบคุณการใช้เครื่องจักร กิจกรรมการแปล.

โครงข่ายประสาทเทียมในการทำงานของนักแปล

ทฤษฎีการแปลด้วยเครื่องซึ่งได้รับการพัฒนาอย่างช้าๆ มาตั้งแต่สมัยโบราณ ได้รับการส่งเสริมอย่างมากนับตั้งแต่ทศวรรษ 1970 นี่เป็นเพราะความก้าวหน้าที่สำคัญในด้านการสร้างแบบจำลองกิจกรรมทางปัญญา นอกเหนือจากความสนใจทางวิทยาศาสตร์ล้วนๆ แล้ว สิ่งนี้ยังอธิบายได้ด้วยบทบาทที่เพิ่มขึ้นของการสื่อสารระหว่างภาษาในโลกสมัยใหม่

นอกจากพจนานุกรมอิเล็กทรอนิกส์และพจนานุกรมการสนทนาแล้ว ในช่วงกลางทศวรรษ 1990 “นักแปลอิเล็กทรอนิกส์” (เริ่มเรียกว่าเทคโนโลยี MT) เริ่มแพร่หลายมากขึ้น โดยหลักการแล้ว “นักแปลอิเล็กทรอนิกส์” คือโปรแกรมที่สามารถประมวลผลข้อความทั้งหมดได้ จริงอยู่ที่ผลลัพธ์ไม่ได้เป็นสิ่งที่จำเป็น และจริงๆ แล้ว มันไม่ได้เป็นสิ่งที่จำเป็นเลย เพื่อให้ผลลัพธ์ของเทคโนโลยี MT กลายเป็นข้อความที่สอดคล้องกันอย่างแท้จริง บุคคลต้องทำงานหนักกับมันมาก

แนวคิดของ "การแปลด้วยเครื่อง" เป็นที่รู้จักกันอย่างแพร่หลาย เราได้รับการแพร่กระจายค่อนข้างกว้าง โปรแกรมในประเทศสไตลัส (ปัจจุบันเรียกว่า พร้อมท์และ โสกราตีส- อย่างไรก็ตาม ความสนใจในโครงการดังกล่าวค่อยๆ ลดลงหลังจากเกิดความอยากรู้อยากเห็นในช่วงแรก และตอนนี้ก็ต่ำลง แม้ว่าจะได้รับการปรับปรุงให้ดีขึ้นอย่างมากก็ตาม ในปัจจุบัน ส่วนใหญ่จะใช้เพื่อทำความคุ้นเคยกับเนื้อหาของเว็บไซต์ภาษาต่างประเทศบนอินเทอร์เน็ต ตลอดจนการอ่านและเขียนอีเมลในภาษาต่างประเทศ

โดยทั่วไปแล้ว งานของนักแปลไม่ได้เปลี่ยนแปลงโดยพื้นฐานตลอดหลายศตวรรษที่ผ่านมา ใช่ คอมพิวเตอร์ปรากฏขึ้น ประเภทของเครื่องพิมพ์ดีดที่รวดเร็วและสะดวกสบาย ใช่แล้ว มี “นักแปลอิเล็กทรอนิกส์” ปรากฏขึ้นแล้ว อย่างไรก็ตาม แม้ว่าเทคโนโลยี MT จะได้รับการปรับปรุงให้ดีขึ้น แต่ก็ไม่ได้กลายเป็นเครื่องมือที่มีการใช้งานที่หลากหลาย และยังประหยัดเวลาและความพยายามอย่างแท้จริง

เทคโนโลยีหน่วยความจำการแปลคืออะไร

เทคโนโลยีได้กลายเป็นเครื่องมือใหม่สำหรับนักแปล การแปล_หน่วยความจำ(TM) ในโลกตะวันตก เทคโนโลยี TM และเครื่องมือสำหรับนักแปลที่สร้างขึ้นบนพื้นฐานของเทคโนโลยีดังกล่าว - Translation Memory Tools (TMT) - เป็นที่รู้จักและใช้กันอย่างแพร่หลาย คุณลักษณะของเทคโนโลยีนี้คือกลไกของกิจกรรมการแปล ไม่ใช่ระบบอัตโนมัติในรูปแบบที่ผู้สร้างเทคโนโลยี MT มองเห็น ยิ่งกว่านั้น วิธีแก้ปัญหาที่เรียบง่ายเมื่อมองแวบแรกนี้ให้ประโยชน์เชิงปฏิบัติมากกว่าแนวคิดระดับโลกเรื่อง “นักแปลอิเล็กทรอนิกส์”

ความแตกต่างจากพจนานุกรมอิเล็กทรอนิกส์และเครื่องมือแปลอื่นๆ ก็คือ โปรแกรมคลาส TM ทั่วไปนั้นใช้โครงข่ายประสาทเทียมที่สามารถจำลองงานได้ในระดับหนึ่ง สมองของมนุษย์เมื่อประมวลผลข้อมูล เครือข่ายเหล่านี้มีความสามารถในการเรียนรู้และวิเคราะห์ชุดข้อมูลที่ซับซ้อนซึ่งยากต่อการประมวลผลโดยใช้อัลกอริธึมเชิงเส้น

โปรแกรมเหล่านี้ใช้อัลกอริธึมแบบคลุมเครือเพื่อค้นหาคำไม่เพียงแต่ในรูปแบบพจนานุกรมเท่านั้น แต่ยังอยู่ในรูปแบบอื่น ๆ ด้วย เช่น ในอีกกรณีหนึ่ง นอกจากนี้ พวกเขาสามารถค้นหาวลีโดยเรียงลำดับคำอื่นได้ ประดิษฐ์เอง โครงข่ายประสาทเทียมสามารถค้นหารูปแบบและกำหนดความสัมพันธ์ระหว่างรูปแบบเหล่านั้นได้ โปรแกรมจะเปรียบเทียบชิ้นงานที่คุณกำลังทำงานอยู่กับเนื้อหาของฐานข้อมูลและให้ข้อมูลนี้แก่จอแสดงผล สามารถระบุได้ว่าแฟรกเมนต์ที่กำหนดนั้นคล้ายกับแฟรกเมนต์ที่คล้ายกันที่มีอยู่ในหน่วยความจำของระบบ เช่น 99%, 74% หรือแม้แต่ 20%

นักแปลทุกคนคุ้นเคยกับความรู้สึกที่ว่าวลีที่เขากำลังดิ้นรนอยู่นั้นเคยพบเจอที่ไหนสักแห่ง กาลครั้งหนึ่ง อย่างน้อยก็ในรูปแบบโดยประมาณ ยิ่งไปกว่านั้น ยังพบเนื้อหาเดียวกันหรือเนื้อหาอื่นที่แปลไว้ก่อนหน้านี้ด้วย มันเป็นเพียงเดจาวูบางประเภท... ฉันอยากจะลองดูวลีนี้ อย่างน้อยก็เพื่อใช้อ้างอิง เพื่อกำหนดรูปแบบที่คุณกำลังทำอยู่ตอนนี้อย่างสมเหตุสมผล...

คุณเริ่มพลิกกลับไปดูต้นฉบับและค้นหาผ่านชั้นหนังสือ และมักเกิดขึ้นว่าพบวลีที่ค้นหาจริง บ่อยครั้งเมื่อสายเกินไปหลังจากที่งานแปลเสร็จสิ้นแล้ว ฉันคิดว่าในขณะนี้ฉันจะให้ทุกอย่างสำหรับเครื่องมือที่จะช่วยฉันค้นหาข้อความที่จำเป็น แม้กระทั่งตอนนี้ เมื่อคุณพิมพ์ข้อความแปลโดยใช้คอมพิวเตอร์แทนที่จะใช้เครื่องพิมพ์ดีด ก็เป็นเรื่องน่าเสียดายเสมอที่จะทำซ้ำบางสิ่งที่เรียบเรียงขึ้นมาด้วยความยากลำบากเช่นนั้น ความฝันอันยาวนานของนักแปลคือการคิดหาวิธีบางอย่างที่จะทำให้เขาไม่ต้องแปลวลีเดิมหลายๆ ครั้ง

แนวคิดประเภทนี้เป็นรากฐานของการสร้างเทคโนโลยีหน่วยความจำการแปลหรือเพียงแค่ TM โดยพื้นฐานแล้วโปรแกรมที่ใช้งานได้ไม่มากก็น้อยเริ่มปรากฏในช่วงปลายยุค 80 - ต้นยุค 90 ในความเป็นจริง โปรแกรมดังกล่าวเป็นเชลล์ควบคุมที่ทำงานร่วมกับฐานข้อมูลปลั๊กอิน (TM) อย่างน้อยหนึ่งรายการ และฉันจะเรียกว่าธนาคารการแปล TM เป็นตู้เก็บเอกสารขนาดใหญ่เวอร์ชันคอมพิวเตอร์ ซึ่งทุกวลีที่คุณเคยแปลจะถูกจัดเก็บเป็นคู่ ทั้งในภาษาต้นฉบับและในภาษาเป้าหมาย แต่ละคู่ดังกล่าวเรียกว่าสองภาษา โปรแกรมจะเตือนคุณทันทีว่าวลีนี้แปลครั้งสุดท้ายอย่างไร การเข้าถึงข้อมูลทำได้ง่ายและรวดเร็ว

ภาพรวมของโปรแกรมหลักของคลาส Translation Memory

ปัจจุบันมีผลิตภัณฑ์ซอฟต์แวร์หลายชนิดที่ใช้เทคโนโลยี TM ในตลาดโลก พวกเขาแตกต่างกันและบางครั้งก็มีนัยสำคัญ อย่างไรก็ตาม พวกเขาทั้งหมดมีบางอย่างร่วมกัน ฟังก์ชั่น.

ตัวอย่างเช่น มักจะมีโปรแกรมแก้ไขข้อความที่มีหน้าต่างคู่ขนานสองหน้าต่าง หน้าต่างหนึ่งมีไว้สำหรับข้อความต้นฉบับ หน้าต่างที่สองสำหรับการแปล เมื่อส่วนข้อความต้นฉบับแสดงในหน้าต่างต้นฉบับ (อาจเป็นประโยค ย่อหน้า หรือคำเดียว) การค้นหาส่วนที่คล้ายกันในฐานข้อมูลจะเริ่มต้นขึ้น หากมีส่วนที่เหมือนกันทุกประการในหน่วยความจำ ส่วนนั้นจะแสดงในหน้าต่างการแปลโดยอัตโนมัติ หากไม่พบแฟรกเมนต์เดียวกันทุกประการ แต่พบสิ่งที่คล้ายกัน แฟรกเมนต์ที่พบจะแสดงในหน้าต่างโปรแกรมโดยระบุเปอร์เซ็นต์ของการจับคู่

นักแปลแก้ไขข้อความแปลที่เสนอโดยโปรแกรมโดยให้สอดคล้องกับต้นฉบับส่งไปยังหน่วยความจำฐานข้อมูลและดำเนินการต่อไป หากไม่พบสิ่งใดเลย นักแปลจะแปลตั้งแต่ต้นโดยพิมพ์ข้อความลงในหน้าต่างการแปล เมื่อทำงานในส่วนนี้เสร็จแล้วนักแปลจะส่งไปยังหน่วยความจำฐานข้อมูลและดำเนินการในส่วนถัดไป ดังนั้นการเติมเต็ม TM จะเกิดขึ้นโดยอัตโนมัติเมื่องานดำเนินไป ทันทีหลังจากที่คนสองภาษาเข้าสู่ TM เธอก็จะกลายเป็น เข้าถึงได้โดยผู้ใช้- หากโปรแกรม TM เปิดอยู่ ไดรฟ์เครือข่ายและผู้ใช้รายอื่นก็ใช้งานได้ จากนั้นนักแปลรายอื่นจะสามารถใช้สองภาษาใหม่ได้ทันที หลังจากที่ส่วนต้นฉบับและส่วนการแปลถูกส่งไปยังฐานข้อมูล ส่วนถัดไปจะแสดงในหน้าต่างต้นฉบับ

โปรแกรมแรกของประเภทนี้เรียกว่า Translation Manager ได้รับการพัฒนาโดย IBM เริ่มแรก IBM ใช้ Translation Manager สำหรับความต้องการของตัวเอง - สำหรับการแปลเป็นภาษาท้องถิ่น (ปรับให้เข้ากับ ภาษาต่างประเทศ) เป็นเจ้าของ ซอฟต์แวร์- จากนั้น Translation Manager ก็ถูกเสนอออกสู่ตลาดในรูปแบบผลิตภัณฑ์เชิงพาณิชย์ และบางครั้งก็มีการผูกขาดในด้านนี้ โปรแกรมนี้ค่อนข้างใช้งานง่าย รวดเร็ว และมีตัวเลือกที่ดีสำหรับการตั้งค่าผู้ใช้แต่ละราย มีหน้าต่างแยกสำหรับฟังก์ชันหลักสามฟังก์ชัน ได้แก่ การแปล หน่วยความจำการแปล และพจนานุกรม หน้าต่าง Translation Memory จะแสดงรายการที่ตรงกันที่พบในหน่วยความจำ ถ้ามี และหน้าต่าง Dictionary จะแสดงคำศัพท์จากพจนานุกรมที่พัฒนาโดย IBM โปรแกรมนี้ยังมีความไม่สะดวก เช่น ขั้นตอนการค้นหาคำแต่ละคำในหน่วยความจำการแปลที่ซับซ้อน

อีกโปรแกรมหนึ่ง - SDLX - ได้รับการพัฒนาตามความต้องการของตัวเองโดยบริษัทอังกฤษ เอสดีแอลมีส่วนร่วมในการแปลซอฟต์แวร์ แต่ละโปรแกรมที่รวมอยู่ในชุดอุปกรณ์ได้รับการติดตั้งแยกกัน จริงๆ แล้ว SDL Edit คือโปรแกรมที่ใช้ในการแปลนั่นเอง มีหน้าต่างสามบานโชว์ แหล่งที่มา, การแปลและหน่วยความจำการแปล ควรสังเกตว่าเอกสารที่จะแปลไม่สามารถนำเข้าไปยัง SDL Edit ได้โดยตรง จะต้องแปลงก่อนโดยใช้ SDL Convert ซึ่งเป็นความไม่สะดวกแน่นอน

โปรแกรม เดจาวูเป็นที่นิยมในหมู่นักแปลในยุโรปเนื่องจากมีความยืดหยุ่นและปรับตัวได้ นอกจากความสะดวกสบายแล้ว เดจาวูยังแตกต่างจากผลิตภัณฑ์อื่นๆ ตรงที่มีอัตราส่วนราคา/คุณภาพสูงสุด เมื่อเปรียบเทียบกับสองโปรแกรมก่อนหน้านี้ ผลิตภัณฑ์ดังกล่าวมีคุณสมบัติที่สะดวกสบายมากมาย ผู้เชี่ยวชาญทราบว่าตั้งแต่เริ่มต้นโปรแกรมนี้ได้รับการพัฒนาโดยติดต่อกับผู้ใช้ในอนาคต เป็นที่ทราบกันว่าDéjà Vu เวอร์ชันล่าสุดได้รับการทดสอบโดยนักแปลชาวรัสเซียโดยเฉพาะ หนึ่งในนั้นคือ Andrey Gerasimov เขียนบทวิจารณ์เชิงบวกเกี่ยวกับโปรแกรมนี้ในนิตยสาร MultiLingual Computing & Technology

โปรแกรมนี้เป็นที่รู้จักในประเทศของเราและเป็นที่นิยมในยุโรป สตาร์ทรานสิต- ในอุดมการณ์ มันแตกต่างอย่างสิ้นเชิงจากผลิตภัณฑ์อื่นๆ ในชั้นเรียนที่เป็นปัญหา คุณได้รับความเข้าใจเกี่ยวกับสิ่งเหล่านี้แล้ว และคุณรู้ว่าพวกเขาทั้งหมดมีฐานข้อมูลความจุสูงส่วนกลาง ซึ่งเป็นที่เก็บข้อมูลการแปล ซึ่งข้อมูลที่จำเป็นจะถูกค้นพบทันที (ถ้ามีแน่นอน) ดังที่ Bill Gates เคยกล่าวไว้ว่า "ข้อมูลอยู่แค่เพียงปลายนิ้วสัมผัส" ดังนั้น โปรแกรม Translation Memory ทั้งหมดจะมีตู้แค็ตตาล็อกอิเล็กทรอนิกส์ แต่ Transit ไม่มี ทุกอย่างแตกต่างกับเขา ข้อมูลต้นฉบับและการแปลจะถูกบันทึกในรูปแบบข้อความเป็นไฟล์ ซึ่งนักแปลจะใส่ไว้ในไดเร็กทอรีตามดุลยพินิจของเขา นักแปลสามารถบอกโปรแกรมได้ว่าไดเร็กทอรีใดและแม้แต่ไฟล์ใดที่เขาต้องการ การขนส่งสาธารณะจะสร้างเครือข่ายการเชื่อมโยงที่เชื่อมโยงซึ่งระบบดังกล่าวใช้งานได้ แม้จะมีข้อดีบางประการ แต่ระบบขนส่งมวลชนก็ไม่ได้ใช้กันอย่างแพร่หลายในรัสเซีย ท้ายที่สุด Promt ซึ่งเป็นผู้จัดจำหน่ายระบบขนส่งอย่างเป็นทางการ ได้เปลี่ยนมาจัดจำหน่าย Workbench ของ Translator ของ Trados

แต่ Workbench ของนักแปลหรือเรียกง่ายๆ ว่า Trados แพร่หลายอย่างรวดเร็วในรัสเซีย อันดับแรกในกลุ่มบริษัทแปล และต่อมาในหมู่นักแปลรายบุคคล สิ่งนี้อาจอธิบายได้ด้วยความจริงที่ว่ามันทำให้สามารถทำงานได้โดยไม่ต้องออกจาก Word ซึ่งสะดวกสบายทางจิตใจมากกว่า ใครชอบดูข้อความที่มีโค้ดทุกชนิดแทรกอยู่ วงเล็บเหลี่ยม- Translator's Workbench (Trados) เมื่อเทียบกับโปรแกรมอื่นๆ จะสะดวกกว่าสำหรับนักแปลทั่วไปที่ไม่ใช่ผู้เชี่ยวชาญด้านการเขียนโปรแกรม เพราะจะเข้าใจได้ดีกว่าโปรแกรมอื่นๆ ประเภทนี้ โดยเฉพาะปุ่มควบคุมมีคำแนะนำเครื่องมือติดตั้งอยู่ ด้วยการใช้ Word ที่คุ้นเคยและเข้าใจง่าย คุณสามารถใช้เครื่องมือทั้งหมดได้ (เช่น ข้อความอัตโนมัติ)

ผลิตภัณฑ์นี้มีเครื่องมือที่มีประโยชน์มากมายซึ่งมีอยู่ในโปรแกรมอื่นเพียงระดับเดียวเท่านั้น หนึ่งในเครื่องมือเหล่านี้คือ Analise ซึ่งช่วยให้คุณวิเคราะห์ข้อความต้นฉบับได้ล่วงหน้า และดูว่ามีการจับคู่ที่ตรงกันทั้งแบบสมบูรณ์และไม่สมบูรณ์หรือไม่ (และในปริมาณเท่าใด) เป็นเรื่องที่ควรค่าแก่การกล่าวถึงเครื่องมือที่สะดวกเช่น Placeables ซึ่งช่วยให้สามารถเปลี่ยนตัวเลขในข้อความได้โดยอัตโนมัติหากทุกสิ่งทุกอย่างในส่วนที่แปลตรงกับสิ่งที่พบในธนาคารการแปล (TM) สะดวกมาก ฟังก์ชั่นอัตโนมัติการแทนที่จุดทศนิยม และ/หรือลูกน้ำเป็นตัวเลข รูปแบบเวลา ตัวย่อ ฯลฯ ตามพารามิเตอร์ที่เหมาะสมที่ผู้แปลระบุไว้

นักแปลภาษารัสเซียส่วนใหญ่ที่ใช้เทคโนโลยี TM ชอบ Workbench ของนักแปล (Trados)

พวกเขามีอะไรเหมือนกัน? โปรแกรมแปลหน่วยความจำ

เมื่อสรุปคำอธิบายของผลิตภัณฑ์ซอฟต์แวร์หลักของคลาส Translation Memory ควรสังเกตว่าตามกฎแล้วมีฟังก์ชันทั่วไปหลายประการ

การผสม-การจัดตำแหน่ง

ฟังก์ชั่นนี้ช่วยให้คุณสร้างธนาคารโอนเงิน (TM) ได้ ไฟล์ที่มีอยู่- จากสองไฟล์ - ไฟล์หนึ่งมีข้อความต้นฉบับและอีกไฟล์มีข้อความแปล - ชุดของสองภาษาจะถูกสร้างขึ้น ตรงข้ามกับประโยคของข้อความต้นฉบับ การแปลจะถูกสร้างขึ้น และอื่นๆ สำหรับไฟล์ทั้งหมดที่นักแปลรวบรวมเป็นคอลเลกชั่นเดียว ระดับความสะดวกของฟังก์ชันการรวมจะแตกต่างกันไปในแต่ละโปรแกรม

การซ่อมบำรุง

เมื่อคนสองภาษาสะสมอยู่ในฐานข้อมูล จำนวนของพวกเขาอาจเพิ่มขึ้นมากจนเนื้อหาของฐานข้อมูลอาจเกินขีดจำกัดทั้งหมด ความไม่ถูกต้องและข้อผิดพลาดบางประการอาจปรากฏขึ้นโดยเฉพาะอย่างยิ่งหากผู้ใช้หลายคนบนเครือข่ายใช้โปรแกรม จะต้องแก้ไขหรือชี้แจงบางสิ่งบางอย่าง หรือแม้กระทั่งลบทิ้งไป พูดตามตรง ต้องบอกว่าเครื่องมือบำรุงรักษาโปรแกรมดังกล่าวไม่สามารถแก้ปัญหานี้ได้อย่างสมบูรณ์ - ในทางปฏิบัติ ยังคงเป็นเรื่องยากที่จะจัดการกับการอุดตันของธนาคารการแปล

พจนานุกรมคำศัพท์เฉพาะทาง - โปรแกรมคำศัพท์เฉพาะทาง

โปรแกรมทั้งหมดที่อยู่ระหว่างการพิจารณาจะมีพจนานุกรมคำศัพท์ของตนเอง ซึ่งโดยพื้นฐานแล้วเป็นพจนานุกรมอิเล็กทรอนิกส์ที่ทุกคนรู้จัก พจนานุกรมคำศัพท์สามารถนำเข้าไฟล์ในรูปแบบพจนานุกรมหรืออภิธานศัพท์ได้ นอกจากนี้ยังสามารถอัปเดตได้ด้วยตนเอง

โปรแกรมแก้ไขข้อความ - โปรแกรมแก้ไขเอกสาร

นี่คือจุดที่กระบวนการแปลเกิดขึ้นจริง เพื่อจุดประสงค์นี้ โปรแกรมทั้งหมดจะมีหน้าต่างสองบานที่กล่าวถึงข้างต้น - สำหรับข้อความต้นฉบับและสำหรับการแปล โปรแกรมแก้ไขข้อความทั้งหมดมีความสามารถในการกำหนดเปอร์เซ็นต์ของความคล้ายคลึงกันระหว่างสิ่งที่กำลังแปลอยู่ ในขณะนี้ข้อความต้นฉบับและข้อความในไลบรารีการแปล ยิ่งคุณตั้งค่าเปอร์เซ็นต์ความคล้ายคลึงกันสูง เช่น 90% หรือ 95% โอกาสที่จะพบข้อความที่ตรงกันก็จะน้อยลงเท่านั้น อย่างไรก็ตาม คุณสามารถกำหนดเปอร์เซ็นต์ให้น้อยลง จากนั้นคุณอาจสะสมเนื้อหาจำนวนมากซึ่งอย่างน้อยก็มีประโยชน์สำหรับการอ้างอิง

ความสอดคล้อง (การเชื่อมโยงการใช้คำกับบริบท) - ความสอดคล้อง

นี้เป็นอย่างมาก คุณสมบัติที่มีประโยชน์ทุกโปรแกรมที่อยู่ระหว่างการพิจารณา บ่อยครั้งคำหนึ่ง (หรือหลายคำรวมกัน) สามารถมีความหมายได้หลายความหมายหรือหลายเฉดสี เมื่อเลือกคำศัพท์ คุณสามารถดูสองภาษาทั้งหมดในคอลเลกชันและในบริบทที่หลากหลายได้ในหน้าต่าง ซึ่งจะทำให้ง่ายต่อการเลือกคำแปลที่ถูกต้องที่สุดสำหรับคำหรือชุดคำที่กำหนด

Natalya Shakhova ผู้อำนวยการหน่วยงาน EnRus เชื่อว่าผลิตภัณฑ์ TM ส่วนใหญ่ช่วยลดความจำเป็นของผู้ใช้ในการทำความคุ้นเคยกับโปรแกรมประมวลผลคำต่างๆ ศึกษาคุณสมบัติก็พอแล้ว โปรแกรมแก้ไขข้อความตัวผลิตภัณฑ์เอง และคุณจะสามารถควบคุมข้อความที่หลากหลายได้ ไม่ว่าจะนำเสนอใน QuarkXPress, FrameMaker หรือ อะโดบี อิลลัสเตรเตอร์- แน่นอนว่ายังมีสิ่งที่จับได้อยู่บ้าง: เพื่อที่จะเชี่ยวชาญโปรแกรมประมวลผลคำถัดไปหรือ ระบบการเผยแพร่คุณจะต้องมีโปรแกรมกรองที่เหมาะสมว่า-อะไร? ถูกต้อง - ขายได้เงินบ้าง! โดยทั่วไปแล้ว ปัญหาเรื่องเงินถือเป็นปัญหาที่ร้ายแรงที่สุดเมื่อพูดถึง TMT พวกมันไม่ถูก (โดยปกติจะหลายร้อยดอลลาร์) และแน่นอนว่าไม่มีความเข้ากันได้ ดังนั้น หากคุณซื้อ (และเชี่ยวชาญ!) ผลิตภัณฑ์สำหรับหนึ่งโครงการ ดังนั้นสำหรับโครงการถัดไป คุณอาจต้องซื้อผลิตภัณฑ์อื่นและใช้เวลาเรียนรู้อีกครั้ง

Natalia Shakhova ตั้งข้อสังเกตเพิ่มเติมว่าตะวันตกกำลังหารือกันอย่างแข็งขันเกี่ยวกับผลที่ตามมาจากการเผยแพร่โครงการดังกล่าวในวงกว้าง หนึ่งในนั้นคือนักแปลมือใหม่เสียโอกาสในการเข้าสู่ตลาด เช่นเดียวกับในรัสเซีย มันเป็นเรื่องยากมากสำหรับนักแปลที่จะรับคำสั่งซื้อหากไม่มีคอมพิวเตอร์และเครื่องพิมพ์ ดังนั้นในต่างประเทศจึงมีปัญหากับการจ้างงานสำหรับนักแปลที่ไม่มีโปรแกรม TM ปรากฏการณ์นี้ก็มีด้านบวกเช่นกัน ด้วยการจ้างเจ้าของโปรแกรม TM ลูกค้าจะได้รับการรับประกันถึงความเป็นมืออาชีพของเขา แต่แม้แต่ผู้เริ่มต้นก็ควรมีโอกาสเริ่มต้น!

ทัศนคติต่อเทคโนโลยี Translation Memory ในประเทศของเรานั้นแตกต่างกัน

เมื่อหน่วยงานแปล Phonetics เริ่มทำงานร่วมกับ Workbench ของ Trados Translator ในปี 1999 แน่นอนว่าในระหว่างการติดต่อกับลูกค้า เราได้พูดคุยเกี่ยวกับการเปลี่ยนไปใช้ เทคโนโลยีใหม่- ตรงกันข้ามกับความคาดหวัง ปฏิกิริยาดังกล่าวมีความระมัดระวังและบางครั้งก็เป็นลบโดยสิ้นเชิง ปรากฎว่าแนวคิดเรื่องการแปลด้วยเครื่องถูกทำลายโดยการใช้โปรแกรมเช่น Stylus และ Socrat อย่างไม่รอบคอบในยุค 90 ยิ่งไปกว่านั้น นักแปลมักใช้คำเหล่านี้ เช่น ไม่มีคุณวุฒิสูงมากนัก ซึ่งไม่สนใจที่จะแก้ไขสิ่งที่ "นักแปลอิเล็กทรอนิกส์" สร้างขึ้น อย่างไรก็ตามสามารถเข้าใจผู้ใช้โปรแกรมเหล่านี้ได้เช่นกัน - การแก้ไขข้อความเหล่านี้ต้องใช้เวลาและความพยายามอย่างมาก

แม้กระทั่งตอนนี้ บางครั้งคุณยังสามารถพบลูกค้าจากองค์กรรัสเซียที่แสดงทัศนคติที่ระมัดระวังต่อนวัตกรรมใดๆ ในด้านซอฟต์แวร์การแปล ในขณะเดียวกัน บริษัทต่างชาติกลับกำหนดให้ต้องใช้โปรแกรมคลาสหน่วยความจำการแปล พวกเขามักจะกำหนดลักษณะที่ต้องการ โดยส่วนใหญ่เป็น Workbench ของ Trados Translator รวมถึง Star Transit พวกเขามักจะมี TM (ธนาคารการแปล) สำเร็จรูปที่พวกเขาเสนอให้ใช้

ในส่วนของนักแปล พวกเขามีความสนใจในเทคโนโลยีหน่วยความจำการแปลอย่างเข้าใจได้ บริษัทตัวแทนแปลมีความสนใจในตัวพวกเขามากยิ่งขึ้น พวกเขาไม่ได้จัดการกับนิยาย วารสารศาสตร์ บทกวี ฯลฯ มากนัก แต่เกี่ยวข้องกับคู่มือการใช้งาน คำแนะนำในการแก้ไขปัญหา และการแปลซอฟต์แวร์ เช่น กับเนื้อหาที่มีข้อความซ้ำหรือคล้ายกัน

ในรูปแบบปัจจุบัน โปรแกรม Translation Memory ดูเหมือนจะถึงขีดจำกัดแล้ว การทำงานเพิ่มเติมในการปรับแต่งเป็นไปตามเส้นทางของการปรับปรุงฟังก์ชันการทำงานที่มีอยู่ สิ่งนี้นำไปสู่ความจริงที่ว่าโปรแกรมต่างๆ มีความยุ่งยากและซับซ้อนมากขึ้นเรื่อยๆ และสิ่งนี้แม้ว่าจะไม่มีแนวคิดใหม่ที่เป็นพื้นฐานก็ตาม Workbench ของนักแปล (Trados) เดียวกันในเวอร์ชันล่าสุดได้รับชุดเครื่องมือดังกล่าวซึ่งเป็นเรื่องยากมากสำหรับผู้ใช้ทั่วไปที่จะเข้าใจพวกเขา

การดำเนินการของโปรแกรมนี้จำเป็นต้องมีพนักงานแยกต่างหากจากเจ้าหน้าที่ของตัวแทนแปล นอกจากคู่มือผู้ใช้แล้ว เอกสารประกอบยังรวมถึงคู่มือผู้เชี่ยวชาญ TRADOS อีกด้วย นอกจากนี้ แพ็คเกจเอกสารประกอบด้วยคู่มือการจัดการโครงการ คู่มือผู้ใช้ MultiTerm และคู่มือผู้ใช้ WinAlign แม้แต่นักแปลที่ผ่านการฝึกอบรมก็ยังต้องใช้ความพยายามและเวลาอย่างมากในการตรวจสอบเอกสารเหล่านี้หลายร้อยหน้า

กลุ่มนักวิจัยจากมหาวิทยาลัยแมริแลนด์ บัลติมอร์เคาน์ตี้ (สหรัฐอเมริกา) ภายใต้การนำของศาสตราจารย์ เอส. นีเรนเบิร์ก ผู้เชี่ยวชาญที่มีชื่อเสียงในสาขานี้ กำลังค้นหาวิธีแก้ปัญหาใหม่ๆ ปัญญาประดิษฐ์และการแปลด้วยเครื่อง จนถึงตอนนี้ การพัฒนาอยู่ในขั้นตอนของการวิจัยเชิงทฤษฎี และเป็นไปได้มากว่าการนำการวิจัยนี้ไปสู่ขั้นของผลิตภัณฑ์เชิงพาณิชย์จะต้องใช้เวลาพอสมควร

เป็นที่น่าสังเกตว่าตลาดเครื่องมือแปลส่วนใหญ่ถูกครอบครองโดยบริษัทต่างชาติ ฉันอยากจะหวังว่าสิ่งนี้จะไม่ดำเนินต่อไปตลอดไป ศักยภาพในการพัฒนาทางทฤษฎีโดยผู้เชี่ยวชาญชาวรัสเซียในสาขาการวิเคราะห์เชิงความหมายนั้นมีขนาดใหญ่มาก การวิจัยของเราในด้านนี้เข้าถึงได้มาก ระดับสูง- มีเหตุผลทุกประการที่คาดหวังว่าการพัฒนาเหล่านี้จะเกิดขึ้นจริงในรูปแบบของเทคโนโลยีภาษาศาสตร์พื้นฐานใหม่ที่จะปลดปล่อยศักยภาพเชิงสร้างสรรค์ของนักแปลอย่างเต็มที่

วารสารนักแปลฝึกหัด“สะพาน” หนึ่งในไม่กี่มืออาชีพ วารสารสำหรับนักแปล วารสารตีพิมพ์บทความโดยนักแปลเฉพาะทางหลากหลายทั้งวาจาและลายลักษณ์อักษร บนหน้านิตยสาร นักแปลที่เชี่ยวชาญด้านความรู้ต่างๆ มีโอกาสหารือเกี่ยวกับประเด็นปัจจุบัน ถกเถียงกัน และแบ่งปันเคล็ดลับทักษะทางวิชาชีพของตน

หน่วยความจำคำแปล

หน่วยความจำการแปล (TM บางครั้งเรียกว่า "หน่วยความจำการแปล") เป็นฐานข้อมูลที่ประกอบด้วยชุดข้อความที่แปลก่อนหน้านี้ รายการหนึ่งในฐานข้อมูลดังกล่าวสอดคล้องกับ "หน่วยการแปล" ซึ่งโดยปกติจะถือเป็นหนึ่งประโยค (โดยมากมักเป็นส่วนหนึ่งของประโยคที่ซับซ้อนหรือย่อหน้า) หากประโยคถัดไปของข้อความต้นฉบับตรงกับประโยคที่เก็บไว้ในฐานข้อมูลทุกประการ (ตรงกันทุกประการ) ก็สามารถแทนที่ข้อความนั้นในการแปลได้โดยอัตโนมัติ ข้อเสนอใหม่อาจแตกต่างเล็กน้อยจากข้อเสนอที่จัดเก็บไว้ในฐานข้อมูล (การจับคู่แบบคลุมเครือ) ประโยคดังกล่าวสามารถแทรกลงในการแปลได้ แต่นักแปลจะต้องทำการเปลี่ยนแปลงที่จำเป็น

นอกเหนือจากการเร่งกระบวนการแปลของส่วนที่ซ้ำกันและการเปลี่ยนแปลงที่ทำกับข้อความที่แปลแล้ว (เช่น ผลิตภัณฑ์ซอฟต์แวร์เวอร์ชันใหม่หรือการเปลี่ยนแปลงทางกฎหมาย) ระบบหน่วยความจำการแปลยังรับประกันความสม่ำเสมอในการแปลคำศัพท์ในส่วนเดียวกัน ซึ่ง มีความสำคัญอย่างยิ่งในการแปลทางเทคนิค ในทางกลับกัน หากนักแปลแทนที่การจับคู่ที่ตรงกันทุกประการที่ดึงมาจากฐานข้อมูลการแปลไปเป็นงานแปลของเขาเป็นประจำ โดยไม่ตรวจสอบการใช้งานในบริบทใหม่ คุณภาพของข้อความที่แปลอาจลดลง

ในแต่ละระบบหน่วยความจำการแปลเฉพาะ ข้อมูลจะถูกจัดเก็บในรูปแบบของตัวเอง (รูปแบบข้อความใน Wordfast, ฐานข้อมูล เข้าถึงข้อมูลใน Deja Vu) แต่มี TMX (รูปแบบ Translation Memory eXchange) มาตรฐานสากล ซึ่งใช้ XML และเกือบทุกระบบซอฟต์แวร์สามารถสร้างได้ ด้วยเหตุนี้ ผลลัพธ์ของงานนักแปลจึงสามารถแลกเปลี่ยนระหว่างแอปพลิเคชันได้ กล่าวคือ นักแปลที่ทำงานกับ OmegaT สามารถใช้หน่วยความจำการแปลที่สร้างใน TRADOS และในทางกลับกัน

อย่างน้อยระบบหน่วยความจำการแปลส่วนใหญ่สนับสนุนการสร้างและการใช้พจนานุกรมผู้ใช้ การสร้างฐานข้อมูลใหม่โดยใช้ข้อความคู่ขนาน (การจัดตำแหน่งภาษาอังกฤษ) ตลอดจนการแยกคำศัพท์แบบกึ่งอัตโนมัติจากข้อความต้นฉบับและข้อความคู่ขนาน

รายชื่อระบบซอฟต์แวร์หน่วยความจำคำแปล

ตามรีวิวการใช้งานระบบล่าสุด หน่วยความจำการแปลระบบที่ได้รับความนิยมมากที่สุด ได้แก่

คำอธิบาย

รายการหนึ่งในฐานข้อมูลดังกล่าวสอดคล้องกับส่วนหรือ "หน่วยการแปล" (หน่วยการแปลภาษาอังกฤษ) ซึ่งโดยปกติจะถือเป็นหนึ่งประโยค (ไม่บ่อยนักที่เป็นส่วนหนึ่งของประโยคหรือย่อหน้าที่ซับซ้อน) หากหน่วยการแปลของข้อความต้นฉบับตรงกับหน่วยการแปลที่จัดเก็บไว้ในฐานข้อมูลทุกประการ (ตรงกันทุกประการ) จะสามารถแทนที่หน่วยการแปลในการแปลได้โดยอัตโนมัติ เซ็กเมนต์ใหม่อาจแตกต่างเล็กน้อยจากเซ็กเมนต์ที่เก็บไว้ในฐานข้อมูล (การจับคู่แบบคลุมเครือ) ส่วนดังกล่าวสามารถแทรกลงในการแปลได้ แต่นักแปลจะต้องทำการเปลี่ยนแปลงที่จำเป็น

นอกเหนือจากการเร่งกระบวนการแปลของชิ้นส่วนที่ทำซ้ำและการเปลี่ยนแปลงที่เกิดขึ้นกับข้อความที่แปลแล้ว (เช่น ผลิตภัณฑ์ซอฟต์แวร์เวอร์ชันใหม่หรือการเปลี่ยนแปลงทางกฎหมาย) ระบบ PP ยังรับประกันความสม่ำเสมอในการแปลคำศัพท์ในส่วนเดียวกันซึ่งก็คือ สำคัญอย่างยิ่งสำหรับการแปลเชิงเทคนิค ในทางกลับกัน หากนักแปลแทนที่การจับคู่ที่ตรงกันทุกประการที่ดึงมาจากฐานข้อมูลการแปลไปเป็นงานแปลของเขาเป็นประจำ โดยไม่ตรวจสอบการใช้งานในบริบทใหม่ คุณภาพของข้อความที่แปลอาจลดลง

ในแต่ละระบบซอฟต์แวร์เฉพาะ ข้อมูลจะถูกจัดเก็บในรูปแบบของตัวเอง (รูปแบบข้อความใน Wordfast, ฐานข้อมูล Access ใน Deja Vu) แต่มีมาตรฐานสากล TMX (eng. รูปแบบ eXchange หน่วยความจำการแปล) ซึ่งใช้ XML และสามารถสร้างได้โดยระบบซอฟต์แวร์เกือบทั้งหมด ด้วยเหตุนี้จึงสามารถนำไปใช้ในการแปลได้ การใช้งานที่แตกต่างกันนั่นคือนักแปลที่ทำงานร่วมกับ OmegaT สามารถใช้ TM ที่สร้างขึ้นใน Trados และในทางกลับกัน

อย่างน้อยที่สุด ระบบ PP ส่วนใหญ่สนับสนุนการสร้างและการใช้พจนานุกรมผู้ใช้ การสร้างฐานข้อมูลใหม่โดยใช้ข้อความคู่ขนาน (การจัดตำแหน่งภาษาอังกฤษ) เช่นเดียวกับการแยกคำศัพท์แบบกึ่งอัตโนมัติจากข้อความต้นฉบับและข้อความคู่ขนาน

ระบบซอฟต์แวร์ PP ยอดนิยม

จากการทบทวนการใช้ระบบ PP ระบบที่ได้รับความนิยมมากที่สุด ได้แก่ :

วิกิพีเดียภาษาอังกฤษมีรายการเปรียบเทียบความสามารถของระบบต่างๆ

มาตรฐานและรูปแบบของหน่วยความจำคำแปล

  • TMX (รูปแบบการแลกเปลี่ยนหน่วยความจำการแปล - การแลกเปลี่ยนหน่วยความจำการแปล) มาตรฐานนี้ช่วยให้สามารถแลกเปลี่ยนระหว่างผู้ให้บริการหน่วยความจำการแปลที่แตกต่างกันได้ TMX เป็นรูปแบบทั่วไปในหมู่นักแปล และเหมาะที่สุดสำหรับการนำเข้าและส่งออกหน่วยความจำคำแปล เวอร์ชันล่าสุดรูปแบบนี้ - 1.4b ช่วยให้คุณสามารถกู้คืนเอกสารต้นฉบับและการแปลจากไฟล์ TMX
  • TBX (รูปแบบการแลกเปลี่ยน Termbase - การแลกเปลี่ยนฐานคำศัพท์) รูปแบบ LISA (Localization Industry Association) นี้กำลังได้รับการแก้ไขและออกใหม่ตามมาตรฐาน ISO 30042 มาตรฐานนี้อนุญาตให้มีการแลกเปลี่ยนคำศัพท์ รวมถึงข้อมูลคำศัพท์โดยละเอียด ฐานหลักของ TBX ถูกกำหนดโดยมาตรฐาน: ISO 12620, ISO 12200 และ ISO 16642 ISO 12620 จัดทำรายการทะเบียนของ "หมวดหมู่ข้อมูล" ที่กำหนดไว้อย่างดี พร้อมด้วยชื่อมาตรฐานที่ทำหน้าที่เป็นประเภทองค์ประกอบข้อมูลหรือค่าที่กำหนดไว้ล่วงหน้า ISO 12200 (หรือที่เรียกว่า MARTIF) จัดเตรียมพื้นฐานสำหรับกรอบงาน TBX ISO 16642 (หรือที่เรียกว่า Terminological Markup Framework) รวมถึง metamodel โครงสร้างสำหรับภาษามาร์กอัปคำศัพท์โดยทั่วไป
  • SRX ได้รับการออกแบบมาเพื่อปรับปรุงรูปแบบ TMX และทำให้การแลกเปลี่ยนหน่วยความจำการแปลระหว่างโปรแกรมมีประสิทธิภาพมากขึ้น ความสามารถในการระบุกฎการแบ่งเซ็กเมนต์ที่ใช้ในการแปลครั้งก่อนช่วยเพิ่มประสิทธิภาพในการระบุเซ็กเมนต์ในข้อความปัจจุบันด้วยเนื้อหาของ PP
  • GMX GILT ย่อมาจาก Globalization, Internationalization, Localization และ Translation มาตรฐาน GILT Metrics ประกอบด้วยสามส่วน: GMX-V สำหรับเมตริกปริมาณ, GMX-C สำหรับเมตริกความซับซ้อน และ GMX-Q สำหรับเมตริกคุณภาพ มาตรฐาน GILT Metrics ที่เสนอมีวัตถุประสงค์เพื่อวัดปริมาณขอบเขตของงานและข้อกำหนดด้านคุณภาพเมื่อดำเนินงาน GILT
  • OLIF เป็นมาตรฐานแบบเปิดที่เข้ากันได้กับ XML ซึ่งใช้เพื่อแลกเปลี่ยนคำศัพท์และข้อมูลคำศัพท์ แม้ว่าเดิมทีจะใช้เป็นวิธีการแลกเปลี่ยนข้อมูลศัพท์ระหว่างพจนานุกรมการแปลด้วยเครื่องที่เป็นกรรมสิทธิ์ แต่รูปแบบก็ค่อยๆ พัฒนาเป็นมาตรฐานทั่วไปมากขึ้นสำหรับการแลกเปลี่ยนคำศัพท์
  • XLIFF (รูปแบบไฟล์การแลกเปลี่ยนการแปล XML Localization - รูปแบบ XML สำหรับการแลกเปลี่ยนร่วมกันระหว่างการแปล) สร้างเป็นรูปแบบไฟล์เดียวสำหรับการแลกเปลี่ยนซึ่งกันและกันซึ่งซอฟต์แวร์การแปลทั้งหมดรู้จัก XLIFF เป็นวิธีที่ดีที่สุดในการแลกเปลี่ยนข้อมูลในรูปแบบ XML ของอุตสาหกรรมการแปล เครื่องมือบางอย่างใช้รูปแบบ XLIFF ที่เป็นกรรมสิทธิ์ซึ่งไม่อนุญาตให้เปิดไฟล์ที่สร้างด้วยเครื่องมือเหล่านี้ในโปรแกรมอื่น
  • TransWS (บริการเว็บการแปล) กำหนดพารามิเตอร์ที่จำเป็นสำหรับการเรียกใช้บริการเว็บเมื่อส่งและรับไฟล์และข้อความที่เกี่ยวข้องกับโครงการแปล มันถูกมองว่าเป็นระบบที่กว้างขวางสำหรับกระบวนการแปลอัตโนมัติโดยใช้บริการบนอินเทอร์เน็ต
  • xml:tm วิธีการใช้หน่วยความจำการแปลนี้อิงตามแนวคิดของหน่วยความจำข้อความ ซึ่งช่วยให้สามารถรวมหน่วยความจำผู้เขียนและหน่วยความจำการแปลเข้าด้วยกัน รูปแบบ xml:tm มอบให้กับ Lisa OSCAR โดย XML-INTL

ข้อดีและข้อเสีย

ข้อดี

  • ลดเวลาและปริมาณงานของนักแปล
  • ปรับปรุงความสอดคล้องของการแปล โดยเฉพาะอย่างยิ่งเมื่อกลุ่มนักแปลกำลังทำงานในโครงการเดียวกัน
  • เพิ่มผลกำไรโดยการเพิ่มประสิทธิภาพการทำงานของนักแปลหรือกลุ่มนักแปล
  • การปรับปรุงคุณภาพการบริการโดยการเพิ่มความแม่นยำและความสม่ำเสมอในการแปลคำศัพท์โดยเฉพาะในข้อความพิเศษ

ข้อบกพร่อง

  • สามารถทำให้การแปล “แห้ง” มากขึ้น; สาระสำคัญของข้อความจะหายไปหากการแปลโดยใช้หน่วยความจำการแปลดำเนินการโดยนักแปลที่มีทักษะต่ำ
  • มักจะไม่มีความเชื่อมโยงระหว่างประโยค/ข้อความที่นำเสนอโดยโปรแกรมกับประโยคข้างเคียงและข้อความโดยรวม
  • ต้นฉบับจะต้องอยู่ในรูปแบบอิเล็กทรอนิกส์
  • ข้อผิดพลาดที่ตรวจไม่พบสามารถแพร่กระจายไปทั่วทั้งโครงการ
  • จำเป็นต้องมีการฝึกอบรมการทำงานตามโปรแกรมและเมื่อมีการเปลี่ยนงาน - อาจจะมากกว่าหนึ่งครั้ง (หากนายจ้างใช้ โปรแกรมที่แตกต่างกันทีเอ็ม)
  • ไม่เหมาะกับข้อความทุกประเภท
  • ซอฟต์แวร์ลิขสิทธิ์ที่มีราคาสูง

ดูเพิ่มเติม

วรรณกรรม

  • Grabovsky V. N. เทคโนโลยีหน่วยความจำการแปล // สะพาน วารสารนักแปล. พ.ศ. 2547 ฉบับที่ 2. - หน้า 57-62.

ลิงค์

  • การใช้โปรแกรมมืออาชีพโดยบริษัทแปลภาษารัสเซีย // Konstantin Dranch, 8 เมษายน 2558

บทความนี้ประกอบด้วยโปรแกรม (โปรแกรมหน่วยความจำการแปล พจนานุกรมอิเล็กทรอนิกส์, โปรแกรมสำหรับการรู้จำข้อความ, โปรแกรมสำหรับคำนวณสถิติ, โปรแกรมสำหรับการแปลแอปพลิเคชัน, โปรแกรมสำหรับแปลเว็บไซต์, โปรแกรมอื่น ๆ สำหรับนักแปล) รวมถึงโปรแกรมฟรีที่ให้คุณแปลข้อความได้มากขึ้นโดยใช้เวลาน้อยลง คำอธิบายโดยย่อของโปรแกรมเหล่านี้มีให้พร้อมลิงก์ไปยังแหล่งข้อมูลหลักสำหรับการดาวน์โหลดและติดตั้ง เราหวังว่าคุณจะพบสิ่งที่มีประโยชน์สำหรับตัวคุณเองที่นี่

โปรแกรมหน่วยความจำการแปล

หน่วยความจำการแปล (หน่วยความจำการแปล, พื้นที่เก็บข้อมูลการแปล) - โปรแกรมที่ช่วยให้คุณ "ไม่แปลสิ่งเดียวกันสองครั้ง" เหล่านี้เป็นฐานข้อมูลที่มีหน่วยข้อความที่แปลก่อนหน้านี้ หากข้อความใหม่มีหน่วยที่อยู่ในฐานข้อมูลอยู่แล้ว ระบบจะเพิ่มลงในการแปลโดยอัตโนมัติ โปรแกรมดังกล่าวช่วยประหยัดเวลาของนักแปลได้อย่างมาก โดยเฉพาะอย่างยิ่งหากเขาทำงานกับข้อความที่คล้ายกัน

ทราดอส- ในขณะที่เขียน Translation memory เป็นหนึ่งในโปรแกรมที่ได้รับความนิยมมากที่สุด ช่วยให้คุณสามารถทำงานกับเอกสาร MS Word การนำเสนอด้วยพาวเวอร์พอยต์, เอกสาร HTML และไฟล์รูปแบบอื่นๆ Trados มีโมดูลสำหรับรักษาอภิธานศัพท์ เว็บไซต์: http://www.translationzone.com/trados.html

เดจาวู- ยังเป็นหนึ่งในผู้นำด้านความนิยม ช่วยให้คุณทำงานกับเอกสารในรูปแบบยอดนิยมเกือบทั้งหมด มีโปรแกรมแยกเวอร์ชันสำหรับนักแปลอิสระและตัวแทนแปล เว็บไซต์: http://www.atril.com/

โอเมก้าที- รองรับรูปแบบยอดนิยมจำนวนมาก แต่เอกสารใน MS Word, Excel, PowerPoint จำเป็นต้องแปลงเป็นรูปแบบอื่น คุณสมบัติที่ดี: โปรแกรมนี้ฟรี เว็บไซต์: http://www.omegat.org/

เมต้าเท็กซ์- ช่วยให้คุณทำงานกับเอกสารในรูปแบบยอดนิยมหลัก โปรแกรมมีสองเวอร์ชันให้เลือก - โมดูลสำหรับ MS Word และโปรแกรมเซิร์ฟเวอร์ เว็บไซต์: http://www.metatexis.com/

MemoQ- ฟังก์ชั่นนี้คล้ายกับ Trados และ Déjà Vu ค่าใช้จ่ายของโปรแกรม (ณ เวลาที่เขียน) นั้นต่ำกว่าระบบยอดนิยมอื่น ๆ เว็บไซต์: http://kilgray.com/

สตาร์ทรานสิต- ออกแบบมาเพื่อการแปลและการแปลเป็นภาษาท้องถิ่น ปัจจุบันเข้ากันได้กับระบบปฏิบัติการ Windows เท่านั้น เว็บไซต์: http://www.star-group.net/DEU/group-transit-nxt/transit.html

เวิร์ดฟิชเชอร์. ระบบฟรีหน่วยความจำการแปลที่สร้างและดูแลโดยนักแปลมืออาชีพ เว็บไซต์: http://www.wordfisher.com/

ข้าม- มีโปรแกรมให้เลือกใช้งาน 4 เวอร์ชันที่แตกต่างกัน ขึ้นอยู่กับขอบเขตของฟังก์ชันการทำงาน เว็บไซต์: http://www.across.net/us/translation-memory.aspx

หญ้าชนิดหนึ่ง- ปีศาจ โปรแกรมที่ต้องชำระเงิน“ผู้สืบทอด” ของโปรแกรม MT2007 เว็บไซต์: http://mt2007-cat.ru/catnip/

พจนานุกรมอิเล็กทรอนิกส์

ที่นี่เราได้นำเสนอเฉพาะพจนานุกรมอิเล็กทรอนิกส์สำหรับ อายุการใช้งานแบตเตอรี่(ไม่มีอินเทอร์เน็ต) มีพจนานุกรมออนไลน์อีกมากมาย จะมีบทความแยกออกมาโดยเฉพาะ แม้ว่าอินเทอร์เน็ตจะเจาะเข้าไปในมุมที่ห่างไกลที่สุดในโลก แต่ก็มีประโยชน์ที่จะมีพจนานุกรมอย่างน้อย 1 พจนานุกรมสำหรับทำงานใน โหมดออฟไลน์- เราดูพจนานุกรมสำหรับการใช้งานระดับมืออาชีพ แต่ไม่รวมพจนานุกรมวลีและพจนานุกรมสำหรับผู้เรียนภาษาไว้ที่นี่

แอบบี้ ลิงโว- ขณะนี้คุณสามารถแปลจาก 15 ภาษา มีโปรแกรมหลายเวอร์ชันที่มีพจนานุกรมขนาดต่างกัน มีเวอร์ชันสำหรับอุปกรณ์พกพา รุ่นที่ต้องชำระเงินพจนานุกรมได้รับการติดตั้งบนคอมพิวเตอร์ของคุณและสามารถทำงานได้โดยไม่ต้องเชื่อมต่ออินเทอร์เน็ต เวอร์ชันฟรีมีเฉพาะทางออนไลน์เท่านั้น โปรแกรมนี้เข้ากันได้กับ Windows, Symbian, Mac OS X, iOS, Android เว็บไซต์: http://www.lingvo.ru/

มัลติทราน- ไม่ใช่ทุกคนที่รู้ว่าพจนานุกรมยอดนิยมนี้มีเวอร์ชันออฟไลน์ สามารถติดตั้งบนคอมพิวเตอร์ (เดสก์ท็อปและขนาดพกพา) สมาร์ทโฟน ใช้งานได้กับ Windows, Symbian และ Android รวมถึง Linux (ผ่านเบราว์เซอร์) ปัจจุบันอนุญาตให้คุณแปลจาก/เป็น 13 ภาษา เว็บไซต์: http://www.multitran.ru/c/m.exe

พร้อมท์- โปรแกรมนี้มีเวอร์ชันสำหรับการใช้งานระดับมืออาชีพ ข้อดีของ Promt คือช่วยให้คุณสามารถทำงานร่วมกับ Trados ได้ เว็บไซต์: http://www.promt.ru/

สโลว์- สามารถแปลจาก/เป็น 14 ภาษา ติดตั้งบน คอมพิวเตอร์ตั้งโต๊ะและแล็ปท็อป อุปกรณ์เคลื่อนที่และผู้อ่าน อเมซอน คินเดิล- ทำงานร่วมกับ ระบบปฏิบัติการ iOS, Android, Windows, Symbian, BlackBerry, บาดา, Tizen พจนานุกรมมีหลายเวอร์ชัน รวมถึงพจนานุกรมเฉพาะเรื่องโดยเฉพาะ เว็บไซต์: http://www.sloved.ru/

โปรแกรมสำหรับการจดจำข้อความ

ABBYY FineReader- จดจำข้อความในรูปถ่าย ภาพสแกน และเอกสาร PDF เวอร์ชันล่าสุด (ณ เวลาที่เขียน) จดจำข้อความใน 190 ภาษา และตรวจตัวสะกด 48 ภาษา คุณสามารถบันทึกข้อความผลลัพธ์ในรูปแบบยอดนิยมเกือบทั้งหมด (Word, Excel, PowerPoint, PDF, html ฯลฯ ) เว็บไซต์: http://www.abbyy.ru/finereader/

คูเนอิฟอร์ม(โอเพ่นโอซีอาร์) โปรแกรมนี้ถูกสร้างขึ้นเป็นผลิตภัณฑ์เชิงพาณิชย์ แต่ปัจจุบันมีการเผยแพร่อย่างเสรี ห้องผ่าตัดเข้ากันได้ ระบบลินุกซ์, แมคโอเอสเอ็กซ์, วินโดวส์ เว็บไซต์: http://openocr.org/

โปรแกรมคำนวณสถิติ

ลูกคิดของนักแปลโปรแกรมฟรีเพื่อนับจำนวนคำในเอกสาร ประเภทต่างๆ- เว็บไซต์: http://www.globalrendering.com/

นับใด ๆ– โปรแกรมที่ต้องชำระเงินพร้อมการตั้งค่าจำนวนมาก เช่น คุณสามารถนับจำนวนตัวอักษรที่มีหรือไม่มีการเว้นวรรค จำนวนคำ บรรทัด หน้า หรือกำหนดหน่วยการนับได้ด้วยตัวเอง เว็บไซต์: http://www.anycount.com/

ไฟน์นับ– โปรแกรมมีให้เลือก 2 เวอร์ชัน เสียเงินและฟรี ซึ่งต่างกันไปตามขอบเขตของฟังก์ชัน เว็บไซต์: http://www.tilti.com/

โปรแกรมสำหรับการแปลแอปพลิเคชัน

โปรแกรมสำหรับการแปลเว็บไซต์

โปรแกรมอื่นๆ สำหรับนักแปล

เครื่องเปรียบเทียบ ApSIC– โปรแกรมสำหรับเปรียบเทียบไฟล์ (ข้อความต้นฉบับ VS ข้อความที่มีการเปลี่ยนแปลงโดยนักแปล) เว็บไซต์.

เมื่อพูดถึงการแปลอัตโนมัติ เรามักจะหมายถึงโปรแกรมที่ดำเนินการแปลโดยใช้เทคโนโลยีการแปลด้วยเครื่อง (Machine Translation) อย่างไรก็ตามมีเทคโนโลยีอื่น - หน่วยความจำการแปลซึ่งถึงแม้จะไม่เป็นที่รู้จักอย่างกว้างขวางในหมู่ผู้ใช้ชาวรัสเซีย แต่ก็มีข้อดีหลายประการ

การพัฒนาอย่างรวดเร็ว ความก้าวหน้าทางเทคนิคนำไปสู่การเพิ่มจำนวน อุปกรณ์ทางเทคนิครถยนต์และอุปกรณ์ที่ซับซ้อนอื่น ๆ โดยไม่มีชีวิต คนทันสมัยแทบจะคิดไม่ถึง ตัวอย่างเช่น ปริมาณเอกสารของเครื่องบินแอร์บัสของยุโรปมีจำนวนนับหมื่นหน้า จากข้อมูลจากการศึกษาที่ดำเนินการเมื่อปลายปี 2547 โดยสมาคม LISA (การสำรวจหน่วยความจำการแปลของ LISA 2004) พบว่า 42% ของผู้ตอบแบบสอบถามแปลประมาณ 1 ล้านคำต่อปี 24% ของบริษัทที่เข้าร่วมการสำรวจมีปริมาณการแปลต่อปี 1-5 ล้าน, 12 % แปลจาก 5 เป็น 10 ล้าน, ปริมาณการแปลของบริษัทอื่นอยู่ที่ 10 ถึง 500 หรือมากกว่าล้านคำต่อปี โดยเฉพาะอย่างยิ่ง ผู้ผลิตส่วนใหญ่ในปัจจุบันไม่ได้จำกัดอยู่เพียงตลาดท้องถิ่นของตน และกำลังพัฒนาตลาดระดับภูมิภาคอย่างแข็งขัน ในขณะเดียวกัน การแปลผลิตภัณฑ์เป็นภาษาท้องถิ่น รวมถึงการแปลคำอธิบายผลิตภัณฑ์เป็นภาษาท้องถิ่น เป็นหนึ่งในข้อกำหนดเบื้องต้นสำหรับการเข้าสู่ตลาดใหม่

ในเวลาเดียวกัน แม้ว่าผู้ผลิตจะออกผลิตภัณฑ์เวอร์ชันใหม่เป็นประจำ เช่น รถยนต์ รถขุด คอมพิวเตอร์ และ โทรศัพท์มือถือ, ซอฟต์แวร์ - ไม่ใช่ทั้งหมดที่มีพื้นฐานแตกต่างจากรุ่นก่อนหน้า บางครั้ง รุ่นใหม่โทรศัพท์เป็นรุ่นก่อนหน้าที่มีการปรับเปลี่ยนเล็กน้อย (หรือปรับสไตล์ใหม่) เวอร์ชันใหม่ขายดีขึ้น ดังนั้นผู้ผลิตจึงต้องอัปเดตผลิตภัณฑ์ของตนเป็นประจำ ด้วยเหตุนี้ เอกสารประกอบของผลิตภัณฑ์แต่ละรายการจึงมักจะเหมือนกัน 70-90% จากเวอร์ชันก่อนหน้า

ปัจจัยสองประการ - เอกสารจำนวนมากที่ต้องแปลและการทำซ้ำจำนวนมาก - ทำหน้าที่เป็นแรงจูงใจในการสร้างเทคโนโลยีหน่วยความจำการแปล (เรียกโดยย่อว่า TM ไม่มีการแปลภาษารัสเซียที่เป็นที่ยอมรับโดยทั่วไปสำหรับคำนี้) สาระสำคัญของเทคโนโลยี TM สามารถสื่อเป็นรูปเป็นร่างได้ในวลีเดียว: “อย่าแปลข้อความเดียวกันสองครั้ง” กล่าวอีกนัยหนึ่ง หน่วยความจำการแปลใช้เพื่อนำคำแปลที่ทำไว้ก่อนหน้านี้กลับมาใช้ใหม่ สิ่งนี้ช่วยให้คุณลดเวลาที่ใช้ในการเตรียมการแปลได้อย่างมาก โดยเฉพาะอย่างยิ่งเมื่อทำงานกับข้อความที่มีการซ้ำซ้อนในระดับสูง

เทคโนโลยีหน่วยความจำการแปลมักสับสนกับการแปลด้วยคอมพิวเตอร์ ซึ่งมีประโยชน์และน่าสนใจอย่างแน่นอน แต่คำอธิบายไม่ใช่จุดประสงค์ของบทความนี้ การใช้เทคโนโลยี TM ช่วยเพิ่มความเร็วในการแปลโดยลดปริมาณงานทางกล อย่างไรก็ตาม สิ่งสำคัญที่ควรทราบคือ TM ไม่ได้ดำเนินการแปลสำหรับผู้แปล แต่เป็นเครื่องมือที่มีประสิทธิภาพในการลดต้นทุนเมื่อแปลข้อความซ้ำๆ

เทคโนโลยี TM ทำงานบนหลักการสะสมผลการแปล: ในระหว่างกระบวนการแปล ข้อความต้นฉบับและการแปลจะถูกจัดเก็บไว้ในฐานข้อมูล TM เพื่ออำนวยความสะดวกในการประมวลผลข้อมูลและการเปรียบเทียบเอกสารต่างๆ ระบบหน่วยความจำการแปลจะแบ่งข้อความทั้งหมดออกเป็น แต่ละชิ้นซึ่งเรียกว่าเซ็กเมนต์ ส่วนเหล่านี้มักเป็นประโยค แต่อาจนำกฎการแบ่งส่วนอื่นๆ มาใช้ เมื่อโหลดข้อความใหม่ ระบบ TM จะดำเนินการแบ่งส่วนและเปรียบเทียบส่วนของข้อความต้นฉบับกับที่มีอยู่แล้วในฐานข้อมูลการแปลที่เชื่อมต่อ หากระบบจัดการเพื่อค้นหาส่วนที่ตรงกันทั้งหมดหรือบางส่วน การแปลจะปรากฏขึ้นเพื่อระบุการจับคู่เป็นเปอร์เซ็นต์ ส่วนที่แตกต่างไปจากข้อความที่บันทึกไว้จะถูกเน้น ดังนั้นนักแปลจึงสามารถแปลเฉพาะส่วนใหม่และแก้ไขส่วนที่ตรงกันบางส่วนเท่านั้น

ตามกฎแล้ว เกณฑ์การจับคู่จะถูกกำหนดไว้ที่ระดับไม่ต่ำกว่า 75% เนื่องจากหากคุณตั้งค่าเปอร์เซ็นต์การจับคู่ที่ต่ำกว่า ค่าใช้จ่ายในการแก้ไขข้อความจะเพิ่มขึ้น การเปลี่ยนแปลงหรือการแปลใหม่ทุกครั้งจะถูกบันทึกไว้ใน TM ดังนั้นจึงไม่จำเป็นต้องแปลสิ่งเดิมซ้ำสองครั้ง!

สิ่งสำคัญคือต้องเติมเต็มฐานข้อมูลหน่วยความจำการแปลอย่างต่อเนื่องโดยจัดเก็บไว้ในฐานข้อมูล (หรือในฐานข้อมูล หากดำเนินการแปลในหัวข้อต่างๆ) คู่ของเซ็กเมนต์ "ข้อความต้นฉบับ - การแปลที่ถูกต้อง" ซึ่งจะช่วยลดเวลาที่ต้องใช้ในการแปลข้อความที่คล้ายกันได้อย่างมาก นอกเหนือจากการลดความเข้มของแรงงานในการแปลแล้ว ระบบ TM ยังช่วยให้สามารถรักษาความเป็นเอกภาพของคำศัพท์และรูปแบบตลอดทั้งเอกสาร

การใช้เทคโนโลยี TM ทำให้นักแปลมีข้อดีดังต่อไปนี้:

  • เพิ่มผลิตภาพแรงงาน การแทนที่ส่วนที่ตรงกันถึง 80% จากฐานข้อมูลการแปลสามารถลดเวลาที่ใช้ในการแปลได้ 50-60% ตามที่แสดงให้เห็นในทางปฏิบัติ การแก้ไขการแปลที่เสร็จสมบูรณ์จะมีประสิทธิภาพมากกว่าการแปลอีกครั้ง - "ตั้งแต่เริ่มต้น";
  • ความสามัคคีของคำศัพท์และรูปแบบต่อหน้าฐานข้อมูลการแปลในเรื่องของเอกสารที่กำลังแปล นี่เป็นสิ่งสำคัญอย่างยิ่งเมื่อแปลเอกสารที่มีความเชี่ยวชาญสูง
  • จัดระเบียบการทำงานของทีมนักแปลด้วยการรับประกันคุณภาพการแปลด้วยการเข้าถึงฐานข้อมูล Translation Memory ทั่วไป

เราสังเกตว่าในประเทศตะวันตกซึ่งเทคโนโลยีหน่วยความจำการแปลได้กลายเป็นเครื่องมือบังคับสำหรับนักแปลมาเป็นเวลานานแล้ว เงินทุนที่ใช้ในการสร้างฐานข้อมูลการแปลไม่ถือเป็นต้นทุน แต่เป็นการลงทุนในงานที่มั่นคงและมีคุณภาพสูง ซึ่ง เพิ่มต้นทุนของกำไรเพียงอย่างเดียว แต่ยังเพิ่มมูลค่าของบริษัทด้วย

ตลาดระบบหน่วยความจำการแปล

ผู้นำที่ไม่มีใครโต้แย้งในตลาดระบบหน่วยความจำการแปลคือโปรแกรม SDL-TRADOS ในฤดูร้อนปี 2548 ผู้พัฒนาระบบ TM รายใหญ่ที่สุดสองรายได้รวมเข้าด้วยกัน - บริษัท SDL และ TRADOS ( ผลิตภัณฑ์ซอฟต์แวร์ภายใต้แบรนด์ TRADOS ซึ่งเป็นที่รู้จักของผู้ใช้จำนวนมาก) และตอนนี้พวกเขากำลังออกผลิตภัณฑ์ร่วมซึ่งเป็นตัวกำหนดมาตรฐานในด้านหน่วยความจำการแปล

ระบบ SDL-TRADOS ใหม่ได้ขยายฟังก์ชันการจับคู่แบบคลุมเครือ (กำหนดค่าโดยผู้ใช้) (ค้นหารายการที่ตรงกันในฐานข้อมูลการแปล) รวมถึงเครื่องมือสำหรับตรวจสอบคุณภาพของเอกสารที่แปล โปรแกรมตรวจสอบการสะกดและปกป้องเนื้อหาของบล็อกหน่วยความจำโดยใช้เทคโนโลยีการเข้ารหัส

ระบบรองรับรูปแบบต่างๆ เช่น คำว่า DOCและ RTF ความช่วยเหลือออนไลน์ RTF, PowerPoint, FrameMaker, FrameMaker +SGML, FrameBuilder, Interleaf, QuickSilver, Ventura, QuarkXPress, PageMaker, SGML/HTML/XML รวมถึงวิธีใช้ HTML, RC (ทรัพยากร Windows), Bookmaster (DCF) และ Troff นอกจากระบบ SDL-TRADOS แล้ว ยังมีระบบ TM อื่นๆ ในตลาดไอทีอีกด้วย ผู้ผลิตชาวฝรั่งเศสเป็นตัวแทนอย่างดีเป็นพิเศษ

ชื่อระบบของบริษัทฝรั่งเศส Atril (www.atril.com) นักพัฒนาได้จัดตั้งสำนักแปลเอกสารทางเทคนิคของตนเองเป็นครั้งแรก หลังจากนั้นจึงเกิดแนวคิดในการสร้างซอฟต์แวร์พิเศษที่ใช้เทคโนโลยีหน่วยความจำการแปล

นี่เป็นแอปพลิเคชันแบบสแตนด์อโลนพร้อมเมนูที่จัดระบบ ระบบสามารถสร้างฐานข้อมูล TM รวมถึงฐานข้อมูลคำศัพท์และเชื่อมต่อพจนานุกรมได้ กระบวนการแปลดำเนินการในเชลล์โปรเจ็กต์พิเศษ โดยที่เมื่อสร้างมันขึ้นมา ไฟล์ที่จำเป็นต้องแปลจะถูกแนบและเชื่อมต่อ การตั้งค่าเพิ่มเติม: ฐานข้อมูล TM พจนานุกรม ฯลฯ ข้อความจะถูกแปลในตารางพิเศษ โดยคุณจะต้องกรอกตัวเลือกการแปลตรงข้ามกับแต่ละคอลัมน์ของต้นฉบับ สิทธิประโยชน์ยังรวมถึง ฟังก์ชั่นเพิ่มเติมสำหรับการแปลไฟล์รูปแบบต่างๆ ซึ่งช่วยให้คุณสามารถรักษารูปแบบเดิมของไฟล์ไว้ได้



2024 wisemotors.ru. วิธีนี้ทำงานอย่างไร. เหล็ก. การทำเหมืองแร่ สกุลเงินดิจิทัล