Results (
Thai) 1:
[Copy]Copied!
คำถามสุด debated ในฟิลด์ของ AVASR คือเมื่อรวมการภาพ และเสียง modalities [3], [4] ระบบส่วนใหญ่สามารถแบ่งออกเป็น 2 กลุ่ม:รวมช่วงต้นและปลายรวม นำต้นรวมระบบการเวกเตอร์ลักษณะก่อนที่จะจัดประเภท มีระดับวัดทั่วไปไม่เกินสองmodalities การ ระบบรวมสายแรกจัดประเภท modality แต่ละอย่างเป็นอิสระ และแล้ว รวม likelihoods แยกสายรวมถูกเลือกสำหรับแพลตฟอร์มนี้ สายร่วมกิจกรรมของแต่ละชั้นสามารถ modalities สองมี fused โครงร่างฟิวชั่นที่เลือกเชิงการคูณใช้ probabilistic เด ชุดรูปแบบเริ่มต้นเลือกผู้สมัครที่วัสดุผลิตภัณฑ์ขนของกิจกรรมผลลัพธ์ N ส่วนของเสียง และภาพ modalities N ถูกตั้งค่าเป็น 4แสดงผลภาพ และเสียงจะถ่วงน้ำหนักกระจายตัวหรือผลต่างของกิจกรรมของพวกเขาออก ซึ่งบ่งชี้ว่า มีความน่าเชื่อถือของ modalities [16] เหล่านี้น้ำหนักปรับบัญชีสำหรับ confusability ของ phonemes เห็น และยังจะconfusability ของ phonemes acoustically ในระดับแตกต่างกันของ SNR
Being translated, please wait..
