Güç Spektral Analizi – Endüstri 4.0 – Ödev Hazırlatma – Tez Yazdırma – Proje Yaptırma Fiyatları – Ödev Örnekleri – Ücretli Proje Yaptırma – Tez Yaptırma Ücretleri
Özellik Çıkarma
Örnekten özellikleri çıkarmak için en iyi yöntemi seçmek, tüm konuşma sisteminin verimliliğine karar verir. Konuşma kısa ve durağan olmayan bir sinyal olduğundan, ondan özellik çıkarmak oldukça deneysel bir iştir. Aishwarya, Tamilce kelimeleri konuşmadan tanımak için farklı özellik çıkarma tekniklerini analiz etti ve sonuçlar tablo haline getirildi ve Tamilce kelimeleri konuşmadan tanımak için kelime ve üç telefon tabanlı yaklaşımlar tartışıldı.
Bu bölüm, konuşma sinyalinden çıkarılabilen çeşitli özellikleri tartışmaktadır. Konuşma özelliği çıkarımı için kullanılabilecek tekniklerden bazıları: Doğrusal Öngörülü Kodlama (LPC), Doğrusal Öngörülü Cepstral Katsayı (LPCC), Mel-Frekans Cepstral Katsayıları (MFCC), Göreli Spektral Filtreleme (RASTA) ve Algısal Doğrusal Öngörü (PLP) analiz; bunlar aşağıda tartışılmaktadır.
Doğrusal Öngörülü Kodlama (LPC)
LPC katsayılarını bulmak için kullanılan adımlardan bahsedilmiştir.
• Ön vurgu: Sayısallaştırılmış konuşma sinyalindeki sayısal, sinyali seviyelendirmek ve sinyali çerçevelerken formant kaybına karşı daha az savunmasız hale getirmek için dijital sistemlerin daha düşük sıralı bir çerçevesi aracılığıyla elde edilir. Tüm sayısallaştırılmış konuşma sinyalinde fark denklemi uygulamak, sinyalde mevcut olan olumsuz etkileri ortadan kaldıracaktır.
• Çerçeveleme: Ön vurgu aşamasının fark denklemindeki sayısallaştırılmış konuşma sinyalini birkaç çerçeveye ayırma; tüm sayısallaştırılmış konuşma sinyalinin bitişik çerçevelerini her biri N numune ile ayırır.
• Pencereleme: Pencereleme, söylem bölümündeki doğal olmayan süreksizlikleri ve temel aralıktaki bükülmeleri gidermek için yapılır. Pencere seçimi hayati bir rol oynar; burada Hamming penceresine karşılık gelen denklem verilmiştir.
• Otokorelasyon analizi: Pencereli konuşma örnekleri arasındaki benzerliği çıkarmak için veri kümesinin analizi yapılır. Sinyalin her pencereli çerçevesi bu aşamada benzerlik açısından analiz edilir.
• LPC analizi: LPC analizi, değerlendirilen formantların yardımıyla sinyalin tüm aralığındaki konuşma örneklerini çıkarmak için bilerek analiz edilen sinyalin gücü ve tekrarı değerlendirilerek gerçekleştirilecektir.
Thiang, tahmine dayalı kodlama yönteminin, YSA kullanarak öznitelikleri doğru bir şekilde çıkararak konuşma sinyallerini tanımak için doğrusal bir yöntem olacağını tartıştı. Ters filtreleme, formantların çıkarılması işlemidir ve kalan sinyalin kaydırılmış görüntüsünün çıkarılmasına kalıntı denir.
Doğrusal Öngörülü Cepstral Katsayısı (LPCC)
Ön vurgudan otokorelasyon analizine kadar aynı işlem yapılır ve daha sonra kepstral katsayı ele alınmalıdır. Özellikler, N’inci pencereli konuşma örneğini referans alarak ve önceki örneklerinin doğrusal kombinasyonu ile ilişkilendirerek çıkarılır.
Sayısallaştırılmış konuşma sinyalinin sayısalından çıkarılan özellikler, kepstral katsayılardır. Cepstral katsayılarını çıkarmak için kullanılan denklem aşağıda verilmiştir. LPCC özellikleri, Sinir Ağları aracılığıyla konuşma sinyallerindeki duyguyu tanımak için Tamil ve Telugu dillerinden çıkarılır.
Algısal Doğrusal Öngörü (PLP)
Konuşmadaki sayısal değeri tahmin etmek için üç teknik gerçekleştirilir: 1) kritik bantlı spektrum için çözünürlük elde ederek, 2) eşit adım eğrisi ve 3) perde yoğunluğu. Konuşma sinyalindeki sayısal için spektral analiz, alınan M örneğinin elde edilen çerçeveleri tarafından daha iyi performans gösterir.
Ses örneklerindeki sayının perde yoğunluğundan tahmini, örnekler güç yasasının da yardımıyla N bant filtrelerinden geçirildikten sonra yapılır. Bu tahmin, bir sonraki gözlem için, yani PLP’yi analiz etmek için verilmiştir. Daha sonra Hızlı Fourier Dönüşümü (FFT) analizi yapılır ve ters FFT alındıktan sonra sadece gerçek değerler vurgulanarak tahmini vektörler elde edilir.
Güç spektral yoğunluğu örnek
Güç spektral yoğunluğu nedir
Güç spektral yoğunluğu MATLAB
Spektral Ne Demek
Özilişki fonksiyonu
Spektral analiz
PSD analizi
Power spectral density
Güç Spektral Analizi
Pencereli konuşma örnekleri için elde edilen güç spektrumu yardımıyla pencereleme sonrası sayısal konuşma örneklerinin frekans bilgileri gözlemlenebilir. Sayısal konuşma örneklerinde frekans bilgisinin oluşumu, Ayrık Fourier Dönüşümü uygulandıktan sonra elde edilir. Zaman alanında bulunan sayısal konuşma örneklerinin tekrarlama bilgilerini sağlar.
FFT, sadece gerçek nokta tahminlerini içerdiğinden, söylem sinyalindeki sayısal perdeyi elde etmede verimliliği artırmak için kullanılmıştır. Filtreleme işleminden sonra alınan müteakip bilgiler, zaman alanında en son teknoloji sinyalin hem göreli büyüklüğünü hem de fazını içerir.
Fourier dönüşümü, zaman alanında bulunan son teknoloji sinyalin daha iyi alınmasına yol açacaktır. İçinde, kaydedilen konuşma örneklerinden güç spektral özellikleri çıkarıldı ve kelime tanıma için yaklaşık %75 doğrulukla sonuçlanan sınıflandırma uygulandı.
Mel Frekans Cepstral Katsayıları
Bu teknik, hem genlik hem de uzaysal alana odaklanmak yerine sadece genlik spektrumunu vurgular, çünkü konuşmadaki sayısalın perde yoğunluğu genlik spektrumundan elde edilebilir. MFCC özniteliklerini çıkarmak için uygulanan adımlardan bahsedilmiştir.
Konuşma örneklerindeki sayısalların çerçevelenmesi ve pencerelenmesi yapılır, ardından filtreleme amacıyla pencereli sayısal konuşma örneklerine FFT uygulanır. Daha sonra, sayısal konuşma örneklerinin filtrelenmesinden elde edilen genlik bilgisi, filtrelenmiş sayısal konuşma örneklerinin faz bilgisi vurgulanmayarak muhafaza edilir.
Ölçekleme ve yumuşatma, diğer bilgileri eleyerek, konuşma sinyalindeki sayısal yoğunluğun yalnızca perdede bilgi almak için gerçekleştirilir. Daha sonra Ayrık Kosinüs Dönüşümü kullanılarak konuşma örneklerinin genlik bilgisi elde edilir.
Karpagavali, MFCC, LPCC ve PLP gibi ünlü başlangıç noktalarını ve özelliklerini kullanarak Tamil hecelerinin tanınmasını araştırdı. Sınıflandırma, Çok Katmanlı Algılayıcı ve Destek Vektör Makinesi algoritmaları kullanılarak yapılmış ve yaklaşık %90 doğruluk elde edilmiştir. Abhishek Verma, özniteliklerin MFCC ile çıkarıldığını ve Evrişimsel Sinir Ağı (CNN) uygulandığını ve bunun %97 daha iyi doğrulukla sonuçlandığını tartıştı.
Dalgacık Dönüşümü
Bir sinyalin zaman-frekans çevirisi, dalgacık dönüşümü yardımıyla işlenir. Ana dalgacığın temel işlevi, yani temel dalgacık, zaman ve frekansta da lokalizedir. Örnekleri gruplamak için pencerenin boyutu, yüksek frekanslardan daha fazla bilgi içerdiğinden, daha düşük frekansları vurgulayan ilgili örneklerde bulunan bilgilere bağlıdır.
Sinyallerin ayrıştırılması, en yoğun bilgilerin vurgulanmasına yol açacaktır. İçinde, konuşmadan Tamilce kelimelerin tanınması için dalgacıklar ve dalgacık paketleri aracılığıyla özellikler çıkarılabilir.
Sayısal konuşma örnekleri ayrıştırılır ve düşük geçişli ve yüksek geçişli filtrelemeye iletilir; burada, düşük geçişli filtrelemeden kırımının sonunda yaklaşık katsayılar elde edilir. Temel bilgiler düşük frekanslı sinyallerde olacağından, yüksek frekanslı sinyallerde çok fazla vurgu yapılmamaktadır. Pencereli sayısal konuşma örnekleri için yaklaşık katsayıların analizi yapılır.
Güç spektral yoğunluğu MATLAB Güç spektral yoğunluğu nedir Güç spektral yoğunluğu örnek Özilişki fonksiyonu Power spectral density PSD analizi Spektral analiz Spektral Ne Demek