Wyniki 1-9 spośród 9 dla zapytania: authorDesc:"DAMIAN CETNAROWICZ"

Estymacja kierunku nadchodzenia dźwięku za pomocą procesora Blackfin

Czytaj za darmo! »

W artykule przedstawiono zagadnienie estymacji kierunku nadchodzącego dźwięku oraz omówiono proces projektowania służącego do tego urzadzenia, które nie tylko wykrywa kierunek dźwięku, ale obraca się w tym kierunku, umożliwiając rejestrację zjawiska generującego zaobserwowany dźwięk. W projekcie wykorzystano procesor sygnałowy Blackfin 535 firmy Analog Devices. W pracy zamieszczono także wyniki eksperymentów potwierdzających prawidłowe działanie opracowanego urządzenia w różnych warunkach akustycznych. Abstract. The paper discusses a problem of estimation of sound direction arrival. In order to verify the correctness of the proposed estimation algorithm in various acoustic conditions, the real device was designed and built, which processes sounds recorded by two microphones. The digital signal processor Blackfin 535 from Analog Devices was used. Presented results of experiments confirm proper operation of the built device and prepared algorithm. (Direction of sound arrival estimation using Blackfin processor). Słowa kluczowe: kierunek dźwięku, metoda korelacyjna, GCC, PHAT, procesor Blackfin. Keywords: direction of sound arrival, correlation method, GCC, PHAT, Blackfin processor. Wstęp Przedmiotem artykułu jest opis projektowania i badania urządzenia wykorzystującego dźwięki w celu zautomatyzowania obserwacji wideo na podstawie zaobserwowanego zjawiska akustycznego lub w celu zwiększenia jakości rejestracji przekazów głosowych. Rozważając rolę przekazów dźwiękowych można wyróżnić dwa przypadki: nadawanie wiadomości głosowych oraz nadawanie sygnałów dźwiękowych pozwalających np. na orientację przestrzenną. Do przekazu wiadomości głosowych i sygnałów dźwiękowych stosuje się różnorodne techniki rejestracji i transmisji dźwięku w celu dostarczenia go do odbiorcy w miejscu oddalonym w przestrzeni lub/i w czasie. Istotne jest, aby przekazywana wiadomość głosowa charakteryzowała się dużą zrozumiałością. Zrozumiałość mowy może być jednak o[...]

Time-delay of arrival estimation from voice signal DOI:10.15199/ELE-2014-002


  This article concerns the issue of the sound source localization in order to automate video surveillance or improve the quality of voice recording. The sounds in general, are a rich medium of convenient communication. The sounds in organized human activities allow for spatial orientation. The case of the voice message is associated with a variety of techniques that involve the recording and transmission of voice, in order to transmit it to the recipient. In this way the voice message can be listened to in a distant location or can be played back at a later time. It is particularly important that the intelligibility of the message conveyed by voice should be high. Speech intelligibility can be limited by properties of equipment, recording or playback conditions. Current technological development provides a variety of solutions to acquire, compress and transmit the speech signals with almost no noticeable reduction in quality, which is confirmed by a subjective assessment. The speech intelligibility very often is reduced by disturbing sounds including traffic noise and other speaking persons. In literature it is called the “cocktail party" problem. It is difficult to cancel the disturbing sounds by filtering in frequency domain because the spectrum of the disturbing sounds overlaps with the spectrum of voice. Using statistical independence the signals can be separated by blind source separation (BSS) methods. Comprehensive review of BSS methods can be found in the book [1]. The authors of this article have already studied the properties of blind separation [2] and its usefulness in applications for hearing aids [3] or for automatic speech recognition in human-machine interfaces [4] [5] [6]. The effective algorithms for independent component analysis (IC A) were considered in [7]. The directional filtering also was investigated for application of speech intelligibility improvement [8]. It was noticed, that the performance o[...]

Śledzenie mówcy wykorzystujące obraz i dźwięk DOI:10.15199/13.2017.4.1


  W artykule przedstawiono eksperymentalne urządzenie do śledzenia poruszającego się mówcy. Urządzenie wykorzystuje informację audio-wideo uzyskaną z kamery i mikrofonów. W obrazie z kamery wykrywana jest twarz i jej położenie. Dwie pary mikrofonów pozwalają na estymację kierunku nadejścia dźwięku przy użyciu uogólnionej metody korelacji wzajemnej. W artykule przedstawiono wyniki eksperymentów. Słowa kluczowe: śledzenie mówcy, system audio-wideo, kierunek nadejścia dźwięku, GCC, PHAT.Potrzeba śledzenia poruszających się obiektów występuje w wielu sytuacjach. Charakteryzują się one występowaniem wielu obiektów, które bez względu czy współdziałają ze sobą czy nie, wykorzystują wspólną przestrzeń. Wzajemne śledzenie wymagane jest do unikania kolizji lub nawiązywania komunikacji. Przy konstruowaniu autonomicznych urządzeń wykonujących różne zadania tzw. robotów, człowiek i jego zachowanie to często wzór do naśladowania przy określaniu mechanizmów ich funkcjonowania. Czynności wykonywane przez człowieka charakteryzują się dużą złożonością związaną z przetwarzaniem bodźców zewnętrznych w celu podjęcia decyzji o sekwencji ruchów do wykonania (np. rękami, nogami lub głową). Naśladowanie ludzkich umiejętności, w tym inteligencji, jest ciągle dużym wyzwaniem. Roboty jako urządzenia mechaniczne charakteryzują się mniejszą możliwością adaptacji do zmieniających się warunków w porównaniu z ciałem człowieka. Procesory do przetwarzania danych multimedialnych nie są tak wydajne jak mechanizmy ludzkich zmysłów. Możliwości mechanicznych konstrukcji przewyższają ludzkie możliwości w sytuacjach, kiedy zakres stosowania jest znacząco ograniczony. Wykorzystując tę specyfikę można próbować rozkładać czynności człowieka na czynności składowe o mniejszej złożoności z punktu widzenia maszynowego naśladowania. W niniejszym artykule przedstawiono eksperyment, w którym urządzenie śledzi położenie poruszającego się mówcy. Funkcjonowanie urządzenia wynika [...]

Automatyczna weryfikacja mówcy oparta na cechach prozodycznych

Czytaj za darmo! »

Rozpoznawanie mówcy jest to proces podejmowania decyzji, w którym wykorzystuje się cechy sygnału mowy w celu określenia, czy dana osoba wyartykułowała określoną wypowiedź. Istnieją dwie główne klasy systemów automatycznego rozpoznawania mówcy: identyfikacja mówcy i weryfikacja mówcy. Identyfikacja mówcy polega na wskazaniu osoby, która wypowiedziała zarejestrowane słowa.Wzadaniu weryfikacji mówcy próbka mowy jest porównywana do modelu mówcy i podejmowana jest decyzja o tym, czy wypowiedź należy do mówcy. Skuteczne rozpoznawanie mówcy w różnych warunkach (zakłóceniach i zniekształceniach) wymaga analizowania sygnału mowy na wielu poziomach. Podział na poziomy wynika z opisu procesu wytwarzania mowy. W czasie rozmowy mówca w charakterystyczny dla siebie sposób formułuje wypowied[...]

Application of scale-invariant feature transform to fingerprint classification


  Recognition of fingerprints is one of the main biometric methods for people identification. In general, the biometric methods aim to determine identity using anatomical or behavioural characteristics. Classical identification methods utilize tokens (keys) or knowledge (passwords). Such methods identify not a person but, in fact, some information, which is held by the person and can be lost or stolen. In the first case this is a kind of trouble but in the latter case this is a kind of danger. Because of these reasons efforts in biometry research are aimed to recognize people by their body or behaviour. Common biometrics are: face, iris, ear, voice, hand geometry, vein geometry, fingerprint, gait, palm print, rhythm of typing, DNA, etc. Each biometric has its advantages and its weakness. Among these, fingerprint is the oldest method of biometric identification [1]. In the late nineteenth century Sir Francis Galton systematized characteristic elements of fingerprint image. These elements are called minutiae and are parameterised by their position, type, and orientation. The best assessment of fingerprint importance is the fact that this is accepted by the law. Currently, since the technological development has arisen, fingerprint is also the biometric with the easiest technique of acquisition [2]. Because of that it is used in locks and even in mobile devices. At the beginning of fingerprint application, the two impressions of a fingerprint were compared manually. It is still the most accurate way for comparison. As computer technology was developed, algorithms for automatic fingerprint matching have been invented. The automatic recognition is much faster but its accuracy is lower. In manual matching a set of minutiae has to be found for each fingerprint. Given these sets, an expert compares minutiae, their positions and other parameters (attributes). A difficulty of this comparison is that the minutiae positions are distorted b[...]

System sterowania gestem z wykorzystaniem czujnika wizyjnego Microsoft Kinect DOI:10.15199/ELE-2014-010


  W związku z rozwojem technologii pozwalających na realizację elementów interfejsów człowiek-maszyna można zauważyć rosnące zainteresowanie rozwiązaniami umożliwiającymi sterowanie gestem. Efektywne sterowanie maszyną przy użyciu gestów wymaga doboru właściwych gestów, które pozwolą na przekazywanie precyzyjnych sygnałów sterujących, a ich rozpoznawanie nie będzie wydłużało czasu potrzebnego na kontakt operatora z maszyną. Przyjmując, że ostateczna weryfikacja przyjętego scenariusza gestów sterujących wymaga przeprowadzenia eksperymentu, Autorzy proponują prototypowe rozwiązanie eksperymentalnego systemu sterowania gestem. Do realizacji systemu wykorzystano powszechnie dostępny sensor Microsoft Kinect, co pozwoliło na ograniczenie kosztów i czasu realizacji systemu. Przedstawiono wyniki analizy kilku scenariuszy sterowania uzyskane zaproponowanym systemem. Przegląd systemów sterowania gestem Systemy sterowania gestem można klasyfikować na podstawie ich różnorodnego zastosowania. Jednym z najpopularniejszych obecnie zastosowań są interfejsy człowiek-komputer umożliwiające bezdotykową obsługę systemów operacyjnych, oprogramowania i urządzeń peryferyjnych. Takie rozwiązania zaproponowano w pracach [1-3]. Autorzy pracy [4] zaproponowali wykorzystanie systemu sterowania gestem do obsługi zestawów telewizyjnych, W pracy [5] zwrócono uwagę na możliwość zastosowania gestów do sterowania interaktywną tablicą, a w pracy [6] - interaktywnym biurkiem. Rozpoznawanie gestów może być wykorzystane do kontroli systemów inteligentnych domów, takich jak np. system sterowania oświetleniem [7]. Popularne jest wykorzystywanie gestów do sterowania robotami mobilnymi [8]. Śledzenie i rozpoznawanie ruchów całego ciała może być wykorzystane do sterowania robotami humanoidalnymi, tak jak zostało to zrealizowane przez autorów prac [9,10]. Innym kryterium podziału omawianych systemów sterowania jest wybrana metoda realizacji rozpoznawania gestów. Jedną [...]

Speaker identification based on Gaussian mixture model - experiments with Polish language utterances

Czytaj za darmo! »

The speech signal conveys several levels of information, however most important is the message coded with the words. Furthermore speech signal conveys information about speaker identity, emotions, health etc. Automatic speaker recognition is a technology that is capable to identify a person who spoke (speaker identification) or to authenticate the speaker's claimed authenticity (speake[...]

PLC - elektroniczny element automatyki przemysłowej DOI:10.15199/48.2018.09.29

Czytaj za darmo! »

Rozwój elektroniki przyczynia się do ciągłego zwiększania obszarów jej zastosowań. Wszechstronne walory użytkowe elektroniki sprawiają, że jest ona wykorzystywana przez osoby, które dość często mogą pozwolić sobie na nieznajomość podstaw działania dyskretnych elementów elektronicznych. Jest to konsekwencja postępu technologicznego przejawiającego się w zaawansowanych konstrukcjach urządzeń zawierających elementy elektroniczne. Czasochłonne rozwijanie umiejętności związanych z wykorzystaniem gotowych urządzeń elektronicznych nie wymaga, a nawet nie pozwala, na zagłębianie się w reguły funkcjonowania wewnętrznych obwodów tych urządzeń. Istnieją dziedziny, których rozwój został zapoczątkowany rozwojem elektroniki np. radiofonia i telewizja. Istnieją również dziedziny które zaistniały zanim elektronika mogła zaoferować swoje rozwiązania. Przykładem takiej dziedziny jest automatyka przemysłowa. Jednym ze zdarzeń, rozpoznawalnych w historii automatyki jest zastosowanie odśrodkowego regulatora obrotów maszyny parowej przez Jamesa Watta. Zdarzenie to datuje się na rok 1788. Osiągnięcie to wyróżniało się pośród innych czego potwierdzeniem jest między innymi umieszczenie wizerunku tego regulatora nad wejściem do Zachodniopomorskiego Uniwersytetu Technologicznego (dawna Wyższa Szkoła Budowy Maszyn). Niewątpliwie był to mechanizm spełniający funkcję regulatora. Regulator jest koniecznym elementem współczesnych układów automatycznej regulacji - układów sterowania. Przykład ten pokazuje, że automatyka była rozpoznawana wcześniej niż elektronika. Dopiero w roku 1968 Dick Morley zaproponował urządzenie MODICON (ang. Modular Digital Controller), które było pierwszym programowalnym układem logicznym (ang. programmable logic controller). Wcześniejsze realizacje sterowania wykorzystywały przekaźniki ze stykami normalnie otwartymi i normalnie zamkniętymi. Właściwe łączenie tych przekaźników było odpowiednikiem programowania układu logiczneg[...]

Układy elektroniczne jako elementy ludzkiego ciała i człowiek jako element układów elektronicznych


  Niektóre współczesne układy elektroniki medycznej, wspomagając osoby niepełnosprawne, pełnią funkcje zastępczych organów. Należą do nich np. implanty ślimakowe ucha wewnętrznego i stymulatory serca. W innych, rozbudowanych systemach elektronicznych, człowiek staje się ich częścią. Jest tak przykładowo w systemach monitoringu i systemach biometrycznych, które służą do rozpoznawania ludzi. W Pracowni Układów Elektronicznych i Przetwarzania Sygnałów (PUEP S) Wydziału Informatyki Politechniki Poznańskiej są podejmowane badania w obu tych kierunkach. W niniejszym artykule przedstawiono wybrane przykłady tych badań. W szczególności omówiono: - poprawę zrozumiałości mowy poprzez separację sygnałów, - Blue Voice - system wspomagania mowy osób laryngektomowanych, - zaawansowane testy audiometryczne, - generację wielotonów nieharmonicznych, - wielokanałowy system do badań bioimpedancyjnych, - detekcję punktów akupunkturowych, - terapię dźwiękiem i diagnostykę akustyczną, - automatyczne rozpoznawanie mówcy. Poprawa zrozumiałości mowy i separacja sygnałów Znaczącym obszarem zastosowań współczesnej elektroniki jest przetwarzanie mowy w celu poprawy komunikacji interpersonalnej. Aparaty słuchowe i telefony przenośne są często używane w miejscach, w których występuje zakłócające tło akustyczne, jak np. rozmowy innych osób, czy odgłosy ruchu ulicznego (tzw. problem "cocktail party"). W takich warunkach, zwłaszcza w przypadku sensorycznych ubytków słuchu, naturalna percepcja słuchowa człowieka (zdolność do przestrzennej filtracji zakłóceń) jest ograniczona, i właśnie dlatego w takich urządzeniach pożądane jest tłumienie dźwięków zakłócających. Nowoczesnym rozwiązaniem tego problemu są wielomikrofonowe filtry kierunkowe. Badania zrozumiałości mowy z wykorzystaniem filtru z dwoma mikrofonami opisano w [1]. Uzyskane charakterystyki kierunkowe przedstawiono na rys. 1. Pomiary zrozumiałości mowy wykazały, że osiągnięto wzrost zrozumiałości m[...]

 Strona 1