Suppose that you are at a music festival checking on an artist, and you would like to quickly know about the song that is being played (e.g., title, lyrics, album, etc.). If you have a smartphone, you could record a sample of the live performance and compare it against a database of existing recordings from the artist. Services such as Shazam or SoundHound will not work here, as this is not the typical framework for audio fingerprinting or query-by-humming systems, as a live performance is neither identical to its studio version (e.g., variations in instrumentation, key, tempo, etc.) nor it is a hummed or sung melody. We propose an audio fingerprinting system that can deal with live version identification by using image processing techniques. Compact fingerprints are derived using a log-frequency spectrogram and an adaptive thresholding method, and template matching is performed using the Hamming similarity and the Hough Transform.
สมมติว่าคุณมีการตรวจสอบในที่เทศกาลดนตรีศิลปินและคุณจะได้อย่างรวดเร็วทราบเรื่องเพลงที่กำลังเล่น ( เช่นชื่อ , เพลง , อัลบั้ม , ฯลฯ ) หากคุณมีมาร์ทโฟน , คุณสามารถบันทึกตัวอย่างของการแสดงสดและเปรียบเทียบกับฐานข้อมูลของการบันทึกที่มีอยู่จากศิลปิน บริการ เช่น แซม หรือ soundhound จะไม่ทำงานที่นี่นี้ไม่ได้เป็นโดยทั่วไปกรอบลายเสียงฮัมหรือแบบสอบถามโดยระบบ เช่น การแสดงสด ไม่เหมือนรุ่นของสตูดิโอ ( รูปแบบต่าง ๆ เช่น ในการใช้เครื่องมือวัด , คีย์ , จังหวะ , ฯลฯ ) หรือเป็น hummed หรือซองเนื้อเพลง เรานำเสนอระบบเสียงที่สามารถจัดการกับชีวิตตัวลายรุ่น โดยใช้เทคนิคการประมวลผลภาพลายนิ้วมือใช้บันทึกขนาดกะทัดรัด ซึ่งทำให้การปรับความถี่และวิธีการปรับตัว และการจับคู่แม่แบบโดยใช้ Method ความเหมือนและ Hough แปลง
การแปล กรุณารอสักครู่..
