Ogłoszenie

**Adam_85** · 21.08.2018, 16:49

Co tu dużo pisać... Grubo :) czapki z głów, robi wrażenie :)

**Yoshi_80** · 22.08.2018, 10:10

Fajny kawałek teorii. Przypomniały mi się czasy studiów :-)

**.3lite** · 22.08.2018, 11:16

Małe rozwinięcie projektu - współczynniki filtru zapisane są teraz na 35 bitach

Przypomniało mi się, że Block RAM w FPGA ma jeszcze tzw. "parity bits" na których można zapisać dodatkowe 4 bity (oprócz standardowych 32 bitów). W praktyce oznacza to wielkość danych na poziomie 36 bitów. Jednostki MAC w moim projekcie mnożyły liczby 32x32 (32 bity na słowo audio oraz 32 bity na współczynnik filtru), ale jako, że są użyte tak czy siak 4 jednostki DSP48A1 to w praktyce można zrobić zwiększyć mnożnik do 35x35 na tych samych jednostkach (DSP48A1 mnoży 18-bitowe liczby z dodatkowym bitem znaku, więc stworzenie mnożnika 32x32 lub 35x35 tak czy siak wymaga 4 takich jednostek). No to zmieniłem moje jednostki MAC w celu wykonywania mnożeń 32x35 oraz zwiększyłem pamięć ROM współczynników do 35 bitów i modliłem się o spełnienie wymagań:

[code]
HDL Synthesis Report

Macro Statistics
# RAMs : 4
16x8-bit single-port Read Only RAM : 1
512x32-bit dual-port RAM : 2
8192x35-bit dual-port Read Only RAM : 1
# Multipliers : 4
35x32-bit multiplier : 4

================================================== =======================

Overall effort level (-ol): High
Router effort level (-rl): High

PAR will use up to 4 processors
Starting Multi-threaded Router

Phase 1 : 11274 unrouted; REAL time: 3 secs

Phase 2 : 8393 unrouted; REAL time: 4 secs

Phase 3 : 2882 unrouted; REAL time: 6 secs

Phase 4 : 3069 unrouted; (Setup:16481, Hold:783, Component Switching Limit:0) REAL time: 7 secs

Updating file: core.ncd with current fully routed design.

Phase 5 : 0 unrouted; (Setup:26243, Hold:176, Component Switching Limit:0) REAL time: 17 secs

Phase 6 : 0 unrouted; (Setup:24205, Hold:176, Component Switching Limit:0) REAL time: 20 secs

Phase 7 : 0 unrouted; (Setup:24205, Hold:176, Component Switching Limit:0) REAL time: 22 secs

Phase 8 : 0 unrouted; (Setup:24205, Hold:176, Component Switching Limit:0) REAL time: 22 secs

Phase 9 : 0 unrouted; (Setup:24205, Hold:176, Component Switching Limit:0) REAL time: 22 secs

Phase 10 : 0 unrouted; (Setup:24205, Hold:0, Component Switching Limit:0) REAL time: 22 secs

Phase 11 : 0 unrouted; (Setup:0, Hold:0, Component Switching Limit:0) REAL time: 23 secs
Total REAL time to Router completion: 23 secs
Total CPU time to Router completion (all processors): 32 secs
[/code]

[code]
================================================== ==============================
Timing constraint: PERIOD analysis for net "CLK_225MHz_int" derived from NET "CLK_50MHz_IBUFG" PERIOD = 20 ns HIGH 50% INPUT_JITTER 0 ns; divided by 4.50 to 4.444 nS and duty cycle corrected to HIGH 2.222 nS
For more information, see Period Analysis in the Timing Closure User Guide (UG612).
48703 paths analyzed, 8504 endpoints analyzed, 0 failing endpoints
0 timing errors detected. (0 setup errors, 0 hold errors, 0 component switching limit errors)
Minimum period is 4.432ns.
-------------------------------------------------------------------------------- [/code]

No i poszło

32 bity to i tak maksymalne słowo audio jakie idzie przesłać, więc nie ma sensu zwiększać je do 35 bitów, ale 3 dodatkowe bity na współczynnik filtru to naprawdę dużo, ponieważ zmniejsza błędy kwantyzacji z typu double na fixed-point.

**tomekk_** · 22.08.2018, 13:38

Informacja

Art. na glowna strone bylby fajny

**.3lite** · 22.08.2018, 13:57

Myślę, że artykuł powinien być bardziej rozwinięty

Na pewno w przyszłości coś dopiszę, ale tego jest tyle, że nie wiadomo za co się zabrać i jak to rozwinąć

**.3lite** · 22.08.2018, 15:11

Teraz może wyjaśnienie dlaczego te dodatkowe 3 bity dla współczynników (z 32 bitów na 35 bitów) jest dosyć znaczące w tym projekcie

Zapis współczynnika filtru typu double-precision floating-point:

[code]-0.0000000020745233141206077[/code]

Zapis z floating-point na fixed-point (odpowiednio 32 oraz 35 bitowy):

[code]-0.0000000020745233141206077 * 2^31 = -4.45~ = -4
-0.0000000020745233141206077 * 2^34 - -35.64~ = -36[/code]

Skalujemy całą liczbę, która składa się tylko z części ułamkowej przez mnożenie całości do n'tej potęgi dwójki (2^31 dla 32 bitów oraz 2^34 dla 35 bitów, jeden bit jest dla znaku współczynnika, tj. liczba ujemna lub dodatnia). Zaokrąglamy wynik do najbliżej wartości, ponieważ po skalowaniu nie da się zapisać części liczby po przecinku w formacie fixed-point.

Zapis z fixed-point (odpowiednio 32 oraz 35 bitowy) z powrotem na double-precision floating-point:

[code] -4 / 2^31 = -0.00000000186264515
-36 / 2^34 = -0.00000000209547579[/code]

Błędy (różnice między faktycznym współczynnikiem a po konwersji na fixed-point z N bitami odpowiednio dla 32 oraz 35 bitów):

[code]0.00000000021187816
0.000000000020952476[/code]

Różnica w błędzie zapisu około 10.11~ razy lepsza dla dodatkowych 3 bitów. W teorii powinna dążyć do 8 (2^3) zależnie od współczynnika i jego zaokrąglenia, które może przechylić w jedną lub drugą stronę. Różnica warta zachodu i dlatego się z tym męczyłem

**.3lite** · 23.08.2018, 17:19

No i dzisiaj jest jedna z tych chwil w których ten projekt zaczyna się robić jeszcze bardziej ciekawy

Filtr dostał dzisiaj częściową re-konfigurację PLLki

Co to oznacza? Filtr nie używa już zegara MCLK do taktowania danych do DAC'a a sam dobiera częstotliwość z którą taktuje dane do przetwornika. W momencie zmiany długości słowa (16, 18, 20 lub 24 bitów) wewnętrzna PLLka się re-konfiguruje na nową częstotliwość i tak o to mamy poniższe częstotliwości zależne od słowa wyjściowego:

16 bitów - 13.5 MHz.
18 bitów - 15.0 MHz.
20 bitów - 16.5 MHz.
24 bity - 19.5 MHz.

Inaczej pisząc ten filtr potrafi taktować takie przetworniki jak PCM56 czy AD1865 z częstotliwością 768 kHz :)

Jak to wygląda w praktyce? Zatrzask danych jest asynchroniczny względem PLLki, więc tylko i wyłącznie od niego zależy jitter:

16 bitów:

18 bitów:

20 bitów:

24 bity:

Ale może jednak jitter!?:

Jak widać nie

Dodatkowe pomiary:

Filtr posiada wejście I2S:

MCLK
BCLK
LRCK
DATA

Z czego MCLK może być podłączone razem z BCLK (po prostu zwarte). MCLK jest tylko i wyłącznie używane do wygenerowania zatrzasku (LE) przetwornika oraz wyciągania danych z FIFO, więc tylko i wyłącznie od niego zależy jitter całości

Filtr potrafi rozpoznać i zaakceptować MCLK zaczynające się od 1.4412 MHz / 1.4536 MHz a kończąc na 45.1584 MHz / 49.152 MHz. W przypadku gdy BCLK jest 64x Fs może on służyć też za MCLK

Nie ma to żadnej różnicy, co lepszej jakości, byle by był synchroniczny względem wyciągania danych nadajnika (MCLK nie może być asynchroniczny bo się po prostu rozjedzie kolejka FIFO).

**Hermes** · 23.08.2018, 19:58

Zamieszczone przez .3lite Zobacz posta

Filtr dostał dzisiaj częściową re-konfigurację PLLki Co to oznacza? Filtr nie używa już zegara MCLK do taktowania danych do DAC'a a sam dobiera częstotliwość z którą taktuje dane do przetwornika. W momencie zmiany długości słowa (16, 18, 20 lub 24 bitów) wewnętrzna PLLka się re-konfiguruje na nową częstotliwość i tak o to mamy poniższe częstotliwości zależne od słowa wyjściowego:

Genialna sprawa

**.3lite** · 23.08.2018, 21:03

Szczerze pisząc to mało powiedziane

Nie sądziłem, że uda się to zmieścić pod względem spełnienia wymagań czasowych. Dane przechodzą przez trzy domeny czasowe (I2S => 225 MHz rdzenia => PLL) i jest to cholernie trudno ogarnąć pod względem naruszeń typu setup / hold w FPGA. Tym bardziej, że musisz mieć pewne flagi pomiędzy różnymi domenami czasowymi. Może kogoś zaciekawi ten temat:

https://en.wikipedia.org/wiki/Metast..._(electronics)
https://www.fpga4fun.com/CrossClockDomain.html
https://www.nandland.com/articles/cr...n-an-fpga.html

W każdym wypadku daleko do końca już nie ma. Na sam koniec zostawiam liczenie współczynników i ich odsłuch, ponieważ to mały pikuś :)

**KAPRINT** · 23.08.2018, 21:23

Przecierasz nowe ścieżki, czy już jakaś firma takie rozwiązania stosowała w swoich przetwornikach.

**.3lite** · 24.08.2018, 09:31

Na pewno znajdzie się wiele filtrów na FPGA w świecie audio, ale nigdy się tym nie interesowałem, więc po prostu nie wiem

Po ostatnich zmianach tak wygląda analiza czasowa dla 225 MHz (najwolniejsza część projektu):

[code] ================================================== ==============================
Timing constraint: PERIOD analysis for net "CLK_225MHz_int" derived from NET "CLK_50MHz_IBUFG" PERIOD = 20 ns HIGH 50% INPUT_JITTER 0 ns; divided by 4.50 to 4.444 nS and duty cycle corrected to HIGH 2.222 nS
For more information, see Period Analysis in the Timing Closure User Guide (UG612).
48341 paths analyzed, 8517 endpoints analyzed, 0 failing endpoints
0 timing errors detected. (0 setup errors, 0 hold errors, 0 component switching limit errors)
Minimum period is 4.292ns.
--------------------------------------------------------------------------------

Paths for end point coeffs_rom/DATA_OUTB_27 (SLICE_X12Y34.B5), 1 path
--------------------------------------------------------------------------------
Slack (setup path): 0.152ns (requirement - (data path - clock path skew + uncertainty))
Source: coeffs_rom_Mram_coefficients_int14 (RAM)
Destination: coeffs_rom/DATA_OUTB_27 (FF)
Requirement: 4.444ns
Data Path Delay: 4.024ns (Levels of Logic = 1)
Clock Path Skew: -0.088ns (0.599 - 0.687)
Source Clock: CLK_225MHz_int_BUFG rising at 0.000ns
Destination Clock: CLK_225MHz_int_BUFG rising at 4.444ns
Clock Uncertainty: 0.180ns

Clock Uncertainty: 0.180ns ((TSJ^2 + TIJ^2)^1/2 + DJ) / 2 + PE
Total System Jitter (TSJ): 0.070ns
Total Input Jitter (TIJ): 0.000ns
Discrete Jitter (DJ): 0.288ns
Phase Error (PE): 0.000ns

Maximum Data Path at Slow Process Corner: coeffs_rom_Mram_coefficients_int14 to coeffs_rom/DATA_OUTB_27
Location Delay type Delay(ns) Physical Resource
Logical Resource(s)
------------------------------------------------- -------------------
RAMB16_X1Y24.DOA1 Trcko_DOA 2.100 coeffs_rom_Mram_coefficients_int14
coeffs_rom_Mram_coefficients_int14
SLICE_X12Y34.B5 net (fanout=1) 1.724 coeffs_rom/read_data_outb_int<27>
SLICE_X12Y34.CLK Tas 0.200 coeffs_rom/DATA_OUTB<28>
coeffs_rom/read_data_outb_int<27>_rt
coeffs_rom/DATA_OUTB_27
------------------------------------------------- ---------------------------
Total 4.024ns (2.300ns logic, 1.724ns route)
(57.2% logic, 42.8% route)

-------------------------------------------------------------------------------- [/code]

Slack na poziomie 0.152 ns - taki zapas do granicy, nic tylko liczyć więcej

W tym wypadku "Minimum period is 4.292ns." wskazuje, że projekt może pracować przy 232.99 MHz. Oczywiście koniec końców zależy to od ułożenia elementów w FPGA przez takie procesy jak MAP i PAR, więc przy dobrych wiatrach można zyskać trochę więcej, ale nie ma to żadnego sensu.

Na razie nic nowego raczej nie planuję dodawać, więc pewnie czas zacząć projektować PCB

**.3lite** · 25.08.2018, 08:24

Poprawiłem troszkę PLLkę i dodałem po 0,5 MHz do każdego słowa wyjściowego (16 bitów - 14 MHz, 18 bitów - 15.5 MHz, 20 bitów - 17 MHz oraz 24 bity - 20 MHz). Po prostu wolę mieć dwa dodatkowe takty (<ilość bitów + 2> * 768 < częstotliwość PLLki) dla procesu od PLLki na zareagowanie względem asynchronicznego zbocza zatrzasku. Dodatkowo doszło następne FIFO (w sumie jest już 6 kolejek dla obu kanałów

), które zaczyna taktować dane do przetwornika dopiero jak będzie co najmniej w połowie pełne. Poniżej pomiary oraz pasmo przenoszenia filtru:

20 kHz:

Biały szum 48 kHz:

Biały szum 44.1 kHz:

Jitter:

Dodatkowo:

[code] ================================================== ==============================
Timing constraint: PERIOD analysis for net "CLK_225MHz_int" derived from NET "CLK_50MHz_IBUFG" PERIOD = 20 ns HIGH 50% INPUT_JITTER 0 ns; divided by 4.50 to 4.444 nS and duty cycle corrected to HIGH 2.222 nS
For more information, see Period Analysis in the Timing Closure User Guide (UG612).
48391 paths analyzed, 8522 endpoints analyzed, 0 failing endpoints
0 timing errors detected. (0 setup errors, 0 hold errors, 0 component switching limit errors)
Minimum period is 4.168ns.
--------------------------------------------------------------------------------

Paths for end point mac2/pipe_int_6_66 (SLICE_X6Y25.CIN), 192 paths
--------------------------------------------------------------------------------
Slack (setup path): 0.276ns (requirement - (data path - clock path skew + uncertainty))
Source: mac2/Mmult_input1_int[31]_input2_int[34]_MuLt_0_OUT3 (DSP)
Destination: mac2/pipe_int_6_66 (FF)
Requirement: 4.444ns
Data Path Delay: 3.893ns (Levels of Logic = 9)
Clock Path Skew: -0.095ns (0.627 - 0.722)
Source Clock: CLK_225MHz_int_BUFG rising at 0.000ns
Destination Clock: CLK_225MHz_int_BUFG rising at 4.444ns
Clock Uncertainty: 0.180ns

Clock Uncertainty: 0.180ns ((TSJ^2 + TIJ^2)^1/2 + DJ) / 2 + PE
Total System Jitter (TSJ): 0.070ns
Total Input Jitter (TIJ): 0.000ns
Discrete Jitter (DJ): 0.288ns
Phase Error (PE): 0.000ns [/code]

W praktyce 240 MHz

**.3lite** · 29.08.2018, 09:32

Mała aktualizacja - wejście I2S filtru nie jest już ograniczone na BCLK do 64x Fs. W praktyce nie ma już żadnego ograniczenia (może być nawet 4x Fs lub 423423x Fs), ponieważ tak czy siak tylko najstarsze 32 bity zostaną zapisane. Najważniejszy jest w tym wypadku LRCK (Fs) i to on decyduje o zatrzaśnięciu danych i przerzuceniu do wejściowego FIFO. Oczywiście mając jakiś egzotyczny BCLK nie będzie możliwe użycie go jako MCLK, ale typowe wartości 32x Fs, 64x Fs lub 128x Fs będą akceptowalne jako MCLK.

Filtr obsługuje poniższe częstotliwości na MCLK:

49.152 MHz
45.1584 MHz
36.864 MHz *
33.8688 MHz *
24.576 MHz
22.5792 MHz
18.432 MHz *
16.9344 MHz *
12.288 MHz
11.2896 MHz
9.2160 MHz *
8.4672 MHz *
6.144 MHz
5.6448 MHz
4.608 MHz *
4.2336 MHz *
3.072 MHz
2.8224 MHz
1.536 MHz
1.4112 MHz

Nie bez powodu jest lista, ponieważ filtr musi wiedzieć jak podzielić częstotliwość aby otrzymać 705.6 kHz lub 768 kHz. Tak samo nie bez powodu dodałem te z gwiazdką (*), ponieważ są to raczej częstotliwości występujące w odtwarzaczach CD

W teorii dodając rezystor (170~ Ohm) na wejścia I2S można go podłączyć pod logikę 5V i powinno chodzić. Na pewno sam to sprawdzę jak będę miał już gotową wersję samego filtru.

Na razie to tyle. W dniu wczorajszym zamówiłem docelowe PCB i jak się nigdzie nie walnąłem to powinno działać

**.3lite** · 30.08.2018, 15:20

PCM56 bez żadnego problemu przyjął na siebie strumień 768 kHz i śmiga:

Oczywiście DAC na pająka to żaden DAC, ale miało działać do testów

**Holgin** · 30.08.2018, 18:03

To ja robię pcb pod różnicowe PCMXX :)

**.3lite** · 30.08.2018, 21:38

Zapas ten przetwornik na pewno ma dosyć duży, ponieważ miałem błąd w którym oscylator nie zmienił częstotliwości i latał na 20 MHz a PCM56 dalej śmigał

Tym bardziej będzie latał przy 14 MHz bez nadwyrężania się jakoś nadzwyczajnie.

**Holgin** · 31.08.2018, 06:35

I po co komu 4 warstwowe PCB, jak starczy płytka uniwersalna?

**kopczas** · 31.08.2018, 21:19

Jakie są realne korzyści dla dźwięku ?

**.3lite** · 01.09.2018, 00:01

Korzyści dla dźwięku na pewno są dosyć znaczące

Filtr posiada 8192 współczynników oraz wykonuje obliczenia 32x35. Nowa próbka tworzona jest na bazie 512 poprzednich próbek (interpolacja 16x). Dodatkowo można śmigać na takich przetwornikach jak PCM56 czy AD1865 do 768 kHz.

Z tego co wiem na rynku nie istnieje inny filtr interpolacyjny, który ma takie możliwości (jest jeszcze filtr kolegi olog z AS, który miał inne założenia projektowe, więc wszystko zależy od potrzeb). Sonicznie już do do własnej oceny

Plusem tego wszystkiego jest to, że filtr z technicznego punktu widzenia jest takim kontenerem na współczynniki, które można zmienić i to one odpowiadają za to jak ten filtr działa oraz jak gra.

Ogłoszenie

Filtr cyfrowy - czyli jak interpolować

Filtr cyfrowy - czyli jak interpolować

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj

Skomentuj