|
Perspektywa, czy to jest aż tak bardzo skomplikowane?
Jacek Kardasiewicz
Na wstępie warto wyjaśnić, że słowo perspektywa, w powszechnym użyciu
jest bardzo ogólne i często niejednoznacznie rozumiane. Czasem oznacza ono perspektywę powietrzną. Innym razem perspektywę linearną. A czasem
jeszcze coś innego. Bywa, że jest kojarzone z plastyką obrazu i głębią ostrości. Niezależnie od zastosowanych środków, celem jest zawsze
możliwie najlepsze oddanie przestrzennego obrazu na płaszczyźnie, czyli na przykład, zarejestrowanie trójwymiarowej sceny, na płaskim
zdjęciu. Tylko w jaki sposób na płaszczyźnie oddać głębię? Już bardzo dawno zauważono, że bardziej oddalone obiekty wydają się być mniejsze
od tych znajdujących się bliżej, że występują tak zwane punkty zbiegu, że im dalej w kierunku horyzontu znajdują obiekty, tym są jaśniejsze i
zazwyczaj mają lekką niebieskawą dominantę. Zauważono też, że obiekty w kolorach ciepłych są przez widza odbierane jako położone nieco
bliżej, niż obiekty w kolorach zimnych. W fotografii dochodzi dodatkowo możliwość sterowania głębią ostrości, która uwydatnia
obiekty o podstawowym znaczeniu. To wszystko może być wykorzystywane do nadania efektu głębi płaskiemu obrazowi, ale i tak zazwyczaj
najważniejsza jest perspektywa linearna i dlatego dalej będziemy się zajmować właśnie linearnym rzutem perspektywicznym.
Jak dotąd były same oczywistości. To zagadnienie nie należy do specjalnie trudnych i być może właśnie dlatego, jest często oceniane
intuicyjnie. Może właśnie ta pozorna prostota jest przyczyną wielu nieporozumień związanych z intuicyjnym pojmowaniem pojęcia
perspektywy. W dalszej części tego tekstu postaram się trochę to wszystko uporządkować. Zacznę od tego, że zagadnienie perspektywy
linearnej, a właściwie rzutu perspektywicznego w fotografii, jest jedynie niewielkim podzbiorem tego, o czym powinien wiedzieć i
pamiętać grafik, czy malarz. Oni muszą cały ten płaski obraz zbudować od podstaw. Muszą rozmieścić horyzont, punkty zbiegu, zdecydować się
na ich ilość, itp.. My musimy jedynie w miarę prawidłowo i w sposób przemyślany zarejestrować na filmie lub na matrycy obserwowaną scenę.
Zacznijmy od podstawowych założeń. Zakładamy, że światło rozchodzi się po liniach prostych, że nie będziemy się zajmować załamaniem,
rozszczepieniem i ugięciem światła na krawędziach przedmiotów. Nie będziemy się też zajmowali głębią ostrości, czyli zakładamy, że
ostrość jest ustawiona na odległość hiperfokalną, a głębia ostrości rozciąga się aż do nieskończoności. Dzięki takim założeniom łatwiej
będzie zagadnienie opisać. Wszyscy doskonale wiemy, że aparat z zapiętym obiektywem ma coś takiego jak oś optyczna. Jest to linia
prosta, zazwyczaj prostopadła do filmu lub matrycy, będąca osią obiektywu i biegnąca aż do nieskończoności. Właśnie ta linia będzie
miała dla nas bardzo duże znaczenie. Przyjmiemy również, że obiektyw ma "środek optyczny", który leży na osi optycznej. Założymy, że ten
"środek optyczny" obiektywu jest punktem, w którym przecinają się wszystkie promienie świetlne wychodzące z dowolnego punktu
trójwymiarowej sceny. Te założenia są niewielkim uproszczeniem, ale pozwolą opisać całe zagadnienie znacznie prostszymi metodami. Błędy
powodowane tymi uproszczeniami są praktycznie pomijalne.
Wszyscy wiedzą ze szkoły, że punkty w przestrzeni trójwymiarowej są opisywane za pomocą trzech współrzędnych: X, Y i Z - jest to typowy
kartezjański układ współrzędnych. My jednak nieco ten układ współrzędnych zmodyfikujemy, bo to umożliwi ograniczenie rozważań do
zagadnień płaskich, co z kolei ułatwi przedstawienie zagadnienia na rysunkach. Zamiast układu kartezjańskiego, będziemy stosowali układ
biegunowy, w którym każdy punkt w przestrzeni jest opisany przez trzy współrzędne:
-
R - promień, który opisuje odległość punktu od środka optycznego obiektywu.
ALFA - kąt na płaszczyźnie PL, pomiędzy linią łączącą zadany punkt P ze środkiem optycznym obiektywu, a osią optyczną.
BETA - kąt obrotu płaszczyzny PL, wokół osi optycznej.
Zapewne łatwiej będzie to zrozumieć po zapoznaniu się ze schematycznym rysunkiem.

Na rysunku widzimy oś optyczną obiektywu, środek optyczny obiektywu O, przykładowy punkt P oraz płaszczyznę PL,
utworzoną przez oś optyczną oraz nasz przykładowy punkt P. Widzimy też promień R oraz kąty ALFA i BETA.
Łatwo zauważyć, że z uwagi na “obrotową” budowę każdego typowego obiektywu (obiektyw ma oś obrotu pokrywającą się z osią optyczną, a
soczewki są okrągłe), możemy się ograniczyć do rozważań na temat tego, co się dzieje na przykładowej płaszczyźnie PL. Wszystkie inne
takie płaszczyzny (choć ich ilość jest nieskończona) będą jedynie obrócone wokół osi optycznej o jakiś inny kąt BETA. Możemy
zatem skupić się na tym co dzieje się na płaszczyźnie PL.

Na rysunku widać dwie dodatkowe wielkości H i L. Wielkości te opisują typowe wzory trygonometryczne: H=R*SIN(ALFA)
i L=R*COS(ALFA). Wartość H będzie oznaczała odległość punktu P od osi optycznej (umowną wysokość obiektu). Wartość
L będzie umowną odległością obiektu od środka optycznego i będzie odpowiadała wynikowi rzutowania promienia R na oś optyczną.
Musimy pamiętać, że robiąc zdjęcie, zawsze będziemy wykorzystywali jedynie szczególny przypadek rzutowania perspektywicznego. Oś optyczna
zawsze będzie przechodziła przez środek kadru (punkt przecięcia przekątnych kadru) i na zdjęciu będzie widoczna jako pojedynczy punkt
lezący dokładnie w środku kadru. Za pomocą typowego obiektywu nie możemy zdjęcia wykonać inaczej. Skręcenie lub przesuniecie osi
optycznej w bok, w dół lub w górę kadru może być wykonane tylko poprzez późniejsze obrabianie już wykonanego zdjęcia, albo przy
zastosowaniu specjalnego obiektywu, ale o tym późnej.
Wystarczy już tych założeń, możemy teraz zastanowić się nad tym jak będzie tworzony dwuwymiarowy obraz trójwymiarowej sceny. Na znanym już
rysunku, w odległości l od środka optycznego, została narysowana linia odpowiadająca położeniu matówki, filmu lub matrycy,
na którą będzie rzutowany obraz.

Wyraźnie widać, że wysokość obiektu, czyli współrzędna punktu P na matówce będzie wynosiła h=H*l/L (wynika to wprost z twierdzenia
Talesa – tego, z greckiego Miletu). Jeśli takich obiektów będzie na zdjęciu kilka i w rzeczywistości będą one miały jednakową wysokość (na
przykład latarnie wzdłuż ulicy), to ich wysokości na matówce nie będą jednak takie same.


Z podanego wzoru jednoznacznie wynika, że będą one tym mniejsze im większa będzie odległość L. Za pomocą podanego wzoru można
dokładnie obliczyć, jaką te obiekty będą miały wysokość na naszej umownej matówce. Jeśli pomiędzy dwa obiekty wstawimy trzeci, to na
matówce, jego wysokość h też znajdzie się pomiędzy wysokościami obu pierwotnych obiektów. A co się stanie jeśli obiekt o wysokości
H zostanie podzielony na trzy równe części?


Nie stanie się nic godnego uwagi, bo wysokość h zostanie podzielona dokładnie w takich samych proporcjach, jak wysokość H
i to niezależnie od tego, z jakiej odległości będziemy taki obiekt obserwować. Widać wyraźnie, że jeden prosty wzór oparty na twierdzeniu
Talesa bardzo dobrze opisuje wszystko, co będzie się działo na każdej płaszczyźnie PL. Ten sam prosty wzór opisuje również wszystkie
zniekształcenia perspektywy, jakie możemy uzyskać celowo lub otrzymać w sposób niezamierzony, na przykład odchylając oś optyczną (jest to
przypadek fotografowania wysokiego budynku ze zbyt małej odległości, z uniesionym do góry obiektywem).


Wyraźnie widać, że w tym przypadku, dla wszystkich trzech punktów będą się zmieniały zarówno wysokości H (zwiększenie tej wartości
powoduje zwiększenie wysokości obrazu na matówce), jak też odległości L (zwiększenie tej wartości działa dokładnie przeciwnie -
powoduje zmniejszanie się obrazu na matówce). W konsekwencji, na matówce nie uzyskamy pożądanego podziału. Wszystkie elementy takiego
obiektu będą skracane - im są wyżej, tym będą krótsze. Tak samo będzie z ich szerokością – im są wyżej, tym będą węższe, ale tu trzeba by
przeanalizować to, co się będzie działo na sąsiednich płaszczyznach PL. Powstaje pytanie, jak można to korygować? Poza prostowaniem w
programie graficznym, które jest rozwiązaniem najgorszym z możliwych, bo zawsze zniekształca detale takiego prostowanego obiektu (program
musi "dorobić" coś, czego na oryginalnym zdjęciu nie było), możliwości są dwie. Pierwsza to zastosowanie specjalnego obiektywu (np. Nikkor
serii PC), który pozwoli na taką modyfikację całego układu optycznego, aby nasza matówka (film lub matryca) nadal była równoległa do
fotografowanego obiektu, pomimo uniesienia osi optycznej ku górze.

Jak widać taki obiektyw nie będzie powodował zniekształceń, pomimo znacznego uniesienia osi optycznej. Druga metoda, to zachowanie
poziomego ustawienia osi optycznej, na przykład kosztem późniejszego kadrowania zdjęcia (wycięcia niepotrzebnego dołu kadru) albo zrobienie
zdjęcia z większej wysokości (najlepiej z wysokości odpowiadającej połowie wysokości fotografowanego obiektu).
I właściwie na tym już koniec. Ten jeden prosty wzór opisuje wszystko co jest związane z linearnym rzutem perspektywicznym, ale oczywiście
tylko wtedy, gdy całe zagadnienie opisujemy matematycznie i na dodatek w układzie biegunowym. Jeśli będziemy chcieli to zagadnienie opisywać
w układzie kartezjańskim, za pomocą współrzędnych X, Y i Z, to również dojdziemy do odpowiednich wzorów, ale nieco bardziej skomplikowanych.
Jeśli chcielibyśmy to wszystko opisać metodami tradycyjnymi, takimi jakich uczą na zajęciach z rysunku, to zapewne zajęłoby to kilka
godzin wykładu i miałoby bardzo dużo różnych przypadków szczególnych i wyjątków.
Można jeszcze zapytać, co będzie się działo z liniami skośnymi względem osi optycznej, liniami, które nie leżą na żadnej płaszczyźnie
PL? Odpowiedź jest bardzo prosta. Nie będzie się działo nic szczególnego.

Na rysunku widać, że jeśli kolejne punkty dowolnej linii prostej będziemy opisywali we współrzędnych biegunowych, to wraz ze zmianami
kąta BETA, dla kolejnych płaszczyzn PL będzie się zmieniała wartość promienia R, czyli odległość tych punktów od
środka optycznego i osi optycznej. Wzory na obliczanie zmian promienia R są równie proste, ale nie będę ich tu podawał, bo nie są do
niczego potrzebne.
Z całego tego materiału wynika, że robiąc zdjęcia scen podatnych na "przerysowania", na przykład zdjęcia architektury, ale również
portrety ludzi, trzeba uważać na możliwe zniekształcenia perspektywy. Szczególnie te, które mogą być nie akceptowalne dla odbiorcy. Trzeba
uważać szczególnie wtedy, gdy obraz zawiera dużą ilość linii prostych, szczególnie poziomych i pionowych, bo tu oko człowieka najszybciej
wykrywa wszelkie odstępstwa od standardu. Warto pamiętać także o tym, że zniekształcona będzie każda płaszczyzna, która nie jest idealnie
równoległa do płaszczyzny matówki (filmu lub matrycy). Jeśli fotografujemy budynki za pomocą typowego obiektywu i nie chcemy, żeby
były krzywe, to musimy zadbać o to, żeby oś optyczna była do takiej ściany (elewacji) prostopadła. Jeśli nie będzie prostopadła, to zawsze
otrzymamy jakieś zniekształcenia. Jeśli oś optyczna będzie ustawiona poziomo, to obserwator zazwyczaj uzna takie zniekształcenia za typowe
(akceptowalne), ale jeśli oś optyczna będzie uniesiona lub opuszczona, to zniekształcenia będą o wiele wyraźniejsze i mogą być drażniące dla
widza (szczególnie jeśli aparat zostanie dodatkowo skręcony i poziom nie będzie odpowiadał poziomowi na zdjęciu), co oczywiście nie
wyklucza tego, że takie zniekształcenia czasem mogą być specyficznym środkiem wyrazu.
Pozostaje jeszcze pytanie, co się będzie działo podczas wykonywania portretu człowieka? Także nic szczególnego. Zastosujemy dokładnie te
same reguły i wzory.

Na tym schematycznym rysunku zaznaczono elementy, które mniej więcej odpowiadają umiejscowieniu nosa i ucha. Wyraźnie widać, że punkty
położone dalej od środka optycznego (ucho) będą na naszym płaskim obrazie mniejsze, bo zwiększy się dla nich odległość L. Za to
element położony najbliżej (nos), będzie największy. Cała głowa będzie dodatkowo zmniejszona, bo zobaczymy tylko jej niewielką część.
Wszystko co znajdzie się poza czerwoną linią, będzie zasłonięte, czyli niewidoczne. To wszystko jest dość oczywiste, ale zazwyczaj trzeba się
jeszcze zastanowić jak duże te wszystkie zniekształcenia będą i jaka powinna być odległość L, żeby te zniekształcenia stały się
akceptowalne. Z podanego wzoru wyraźnie widać, że zniekształcenia występują zawsze i nie da się ich uniknąć, ale im większa będzie
odległość pomiędzy środkiem optycznym, a obiektem, tym te zniekształcenia będą mniejsze. Właśnie dlatego klasycznych portretów
nie robi się z małych odległości. Biorąc do ręki linijkę, kalkulator i stosując wzór podany na początku, możemy dość dokładnie wyliczyć
wszystkie zniekształcenia obrazu, które uzyskamy, robiąc zdjęcie dowolnego obiektu, z określonej odległości.
Jak widać, nigdzie dotąd nie wystąpiło pojęcie ogniskowej obiektywu. Po prostu rzut perspektywiczny nie zależy od ogniskowej. W ogóle nie
zależy on od zastosowanego obiektywu i aparatu. Do przedniej soczewki dociera już praktycznie płaski obrazek, będący wynikiem
perspektywicznego rzutowania rzeczywistej trójwymiarowej sceny. Perspektywa i zniekształcenia perspektywy zależą tylko od dwóch
parametrów: od odległości pomiędzy aparatem, a fotografowanymi obiektami oraz od położenia fotografowanych obiektów względem osi
optycznej. Bardzo łatwo to wywnioskować intuicyjnie, bez dokonywania żadnych obliczeń. Żeby obraz mógł być zarejestrowany przez aparat, do
obiektywu (na takiej samej zasadzie jak do ludzkiego oka) muszą dotrzeć wszystkie "promienie świetlne" (będące liniami prostymi),
wyprowadzone ze wszystkich punktów fotografowanej sceny. Właśnie te "promienie świetlne" pozwalają później zarejestrować obraz na filmie,
czy matrycy. Dopóki nie dotrą one do obiektywu, nie mogą być przez ten obiektyw nijak modyfikowane, uginane, załamywane, czy zakrzywiane – to
jest chyba oczywiste. Obiektyw nie może więc wpływać na ich przebieg pomiędzy fotografowana sceną, a przednią soczewką, czyli nie może
także wpływać na ogólnie rozumianą perspektywę. Jedyne co obiektyw może zrobić, to w szczególnych przypadkach spowodować, że pewne
elementy obrazu będą mniej ostre niż inne, może też wprowadzić własne błędy, ale podstawowej geometrii tego obrazu zmienić już nie może.
Jak więc ma się do tego wszystkiego obiektyw? To też dość proste. Jedynym, poza głębią ostrości, dystorsjami i aberracjami, pośrednim
wpływem obiektywu wraz z aparatem na perspektywę rejestrowanej sceny, jest kąt widzenia. Kąt widzenia zależny zarówno od obiektywu, jak tez
od aparatu – od wielkości klatki. Kąt widzenia, który ogranicza obszar obrazu rejestrowanej sceny. Jeśli obiektyw ma zbyt długą ogniskową, to
ma również zbyt mały kąt widzenia, aby zarejestrować cały obszar sceny, ale środek tej sceny zawsze zostanie zarejestrowany tak samo,
jak w przypadku innego dowolnego obiektywu. Jeśli ogniskowa będzie zbyt krótka, to kąt widzenia będzie zbyt duży i rejestrowana scena
wypełni tylko niewielką część kadru (będzie konieczne powiększanie środka kadru). W konsekwencji, jeśli ogniskowa obiektywu jest zbyt
długa, to musielibyśmy odejść dalej, a jeśli zbyt krótka, to podejść bliżej, tym samym zmieniając parametry rzutowania perspektywicznego,
ale zmieniając parametry rzutowania ze względu na odległość od fotografowanego obiektu, a nie na ogniskową. Jeśli zrobimy dwa zdjęcia
z tego samego miejsca, ze statywu, na przykład dla ogniskowej 20 mm i 70 mm, a następnie powiększymy środek zdjęcia zrobionego ogniskową 20
mm tak, żeby kadr obejmował taki sam obszar sceny, jak dla ogniskowej 70 mm, to otrzymamy dwa takie same zdjęcia. Oczywiście z pominięciem
parametrów, które nie mają wpływu na rzut perspektywiczny, takich jak na przykład głębia ostrości oraz różnego rodzaju dystorsji i
aberracji. Nikt z rodziny nie zdecydował się na pozowanie w celu zobrazowania zniekształceń perspektywy, więc zamieszczę tylko dwa
zdjęcia lalki przedstawiającej Hansa Christiana Andersena, tego od duńskich bajek. Oba zdjęcia zostały zrobione z tego samego miejsca,
ale pierwsze obiektywem o ogniskowej 17mm, a drugie standardową 50mm. Zdjęcie z 17mm zostało następnie powiększone i poddane kadrowaniu, a
oto wyniki:


Twierdzenia, że perspektywa (rzut perspektywiczny) zależy od ogniskowej obiektywu, można chyba między bajki włożyć.
Pozostało jeszcze tylko jedno zagadnienie. W naszym wzorze mamy wartość l, która jest odległością matówki, filmu lub matrycy od
środka optycznego. Ta wartość (po pewnych mało istotnych uproszczeniach) wynika bezpośrednio z równania soczewki i jest zależna
od odległości pomiędzy środkiem optycznym, a fotografowanym obiektem (tym obiektem, na który ustawiono ostrość). Po przekształceniu
równania soczewki otrzymamy wzór: l=F*(Y/(Y-F)), gdzie F jest ogniskową, a Y odległością ostrzenia. Widać wyraźnie, że
jeśli odległość Y jest dużo większa od ogniskowej (na przykład ogniskowa ma 50 mm, a odległość wynosi 10 m), to wartość l jest
bardzo bliska ogniskowej F. Dla typowych przypadków można więc z dobrym przybliżeniem uznać, że jest to wartość równa ogniskowej.
Przy okazji możemy tez zauważyć, że kąt widzenia obiektywu o stałej ogniskowej wcale nie jest stały i zmienia się nieznacznie wraz ze
zmianami odległości ostrzenia.
Świadome robienie zdjęć powinno polegać na tym, że fotograf zaczyna od wybrania miejsca, z którego najlepiej będzie wykonać dane zdjęcie,
biorąc od uwagę warunki oświetlenia, ale również perspektywę, jaką uzyska na zdjęciu. Na tym etapie fotograf powinien przewidzieć
wszystkie możliwe zniekształcenia obrazu, zaakceptować je, albo zmienić miejsce, z którego zrobi zdjęcie. Dopiero na samym końcu może
on dobierać obiektyw i jego ogniskową. Dobierać je tak, żeby z miejsca, które wybrał, mógł sfotografować taki obszar sceny, jaki chce
mieć na finalnym zdjęciu. Właśnie tak, a nie odwrotnie. Nie bez przyczyny fotografowie z wieloletnim stażem i dużym doświadczeniem
twierdzą, że zoomy nie są obiektywami dla początkujących. Początkujący adept fotografii powinien nauczyć się robienia zdjęć za pomocą
obiektywów o stałej ogniskowej, bo tylko wtedy ma szansę nauczyć się prawidłowego doboru perspektywy. Zoom i tak zwane przybliżenia, nigdy
nie zastąpią świadomej zmiany miejsca, z którego robione jest zdjęcie.
Na koniec, idąc za podpowiedzią kolegi Alf'a, kilka rad dla początkujących fotografów architektury (portretów również):
-
przed zrobieniem zdjęcia dokładnie przemyśl, co i jak chcesz sfotografować, jakie chcesz osiągnąć efekty,
-
popatrz na fotografowana scenę z różnych miejsc i z różnych odległości,
-
jeśli nie chcesz, żeby obiekt był zniekształcony, poszukaj miejsca możliwie najbardziej oddalonego,
-
sprawdź, czy będziesz mógł zrobić zdjęcie nie podnosząc obiektywu ku górze i nie skręcając aparatu w płaszczyźnie
prostopadłej do osi optycznej,
-
jeśli masz wątpliwości, że się to nie uda, poszukaj miejsca położonego nieco wyżej (np. schodków przy sąsiednim budynku),
-
obiektyw i jego ogniskową dobieraj na końcu, już po wybraniu miejsca, z którego chcesz zrobić zdjęcie,
-
jeśli to możliwe, staraj się nie podnosić obiektywu i zachować poziome ustawienie aparatu, nawet kosztem zostawienia niepotrzebnego
marginesu na dole kadru,
-
pamiętaj, że każde skręcenie aparatu i podniesienie lub opuszczenie obiektywu w efekcie dadzą istotne zniekształcenia perspektywy,
-
jeśli jest to możliwe, staraj się robić zdjęcia architektury ze statywu – łatwiej wtedy uniknąć przypadkowej zmiany położenia
aparatu i obiektywu względem fotografowanej sceny, łatwiej też wszystko sprawdzić i przemyśleć,
-
zawsze wybieraj obiektyw o nieco mniejszej ogniskowej, (większym kącie widzenia) i zostawiaj niewielkie marginesy, bo to ułatwi
poprawienie w programie graficznym kadrowania i ewentualnych błędów perspektywy (prostowanie),
i jeszcze dwie ważne uwagi:
-
pamiętaj, że złamać można każdą z powyższych zasad, ale trzeba to najpierw dokładnie przemyśleć i mieć na to szczególne uzasadnienie,
-
zapamiętaj...lenistwo przy kadrowaniu jest największym wrogiem dobrego zdjęcia architektury!
Powrót do Technics
|