Introducció a l'àlgebra lineal
Taula de continguts
- 1. Introducció als vectors
- 1.1. De segments a vectors: suma i resta
- 1.2. Notació, mòdul i vector unitari
- 1.3. Multiplicació de vector per escalar
- 1.4. Vector = mòdul · unitari
- 1.5. Producte escalar: projeccions
- 1.6. Commutativitat del producte escalar
- 1.7. Producte vectorial: àrea
- 1.8. Anticommutativitat del producte vectorial
- 1.9. Benvinguda a Descartes
- 1.10. Vectors i coordenades
- 1.11. Els vectors canònics
- 1.12. Descartes i Pitàgores
- 1.13. Diferents bases
- 1.14. Re-escalar un vector
- 1.15. Producte escalar, segona part
- 1.16. Producte vectorial, segona part
- 2. Equacions lineals
- 3. Espais vectorials
- 4. Matrius i bases
- 4.1. Matrius com a màquines
- 4.2. Descripció d'una matriu
- 4.3. Multiplicacions amb matrius
- 4.4. Sistema d'equacions lineals
- 4.5. El paper de les matrius
- 4.6. Matriu de canvi de base
- 4.7. Les columnes de la matriu
- 4.8. Determinant
- 4.9. Matrius de transformació lineal
- 4.10. Alícia i Berta
- 4.11. Alícia i Berta, 2a part
- 5. Aplicacions lineals
1. Introducció als vectors
En
aquest capítol farem una petita introducció als vectors, enfocada
sempre des d'un punt de vista espacial i geomètric i sacrificant el
rigor formal en favor d'una visió intuïtiva. A les matemàtiques, però,
es poden definir vectors de forma molt abstracta, però dins d'un context
arquitectònic prescindirem d'aquestes generalitats per donar
protagonisme als vectors que viuen a l'espai natural, tant en 2 com en 3
dimensions.
1.1. De segments a vectors: suma i resta
Recordem com als Elements
d'Euclides teníem la possibilitat de sumar i restar segments. Si ens
donen un segment blau i un altre vermell, els posem en fila, alienats, i
el segment verd serà el segment suma.
Com
a novetat, hem marcat amb una punta de fletxa un dels costats del
segment. Aquesta punta és el que distingeix un segment (on els dos
extrems són iguals) d'un vector (on un extrem no té punta de fletxa i
l'altre sí). A l'extrem que no té punta de fletxa li podem dir cua i a
l'extrem amb punta li podem dir cap.
Per tant, un vector és un segment al qual distingim cua i cap. Comparteix amb el segment la propietat de definir una recta, és a dir, una direcció. Però a més, el vector, a diferència del segment, distingeix un sentit dins d'aquesta direcció. El sentit sempre s'interpreta des de la cua cap a la punta.
A la figura anterior, veiem que la forma de sumar és simplement connectar la cua del nou vector amb la punta del vector anterior. La suma és simplement el vector que va des de la primera cua fins a la darrera punta.
I si ara apliquem
aquest procediment sense necessitat de que els dos vectors estiguin
alineats? Sumem el vector blau i el vermell de forma que el verd sigui
la suma.
Hem mantingut la regla: concatenem els vectors que volem sumar i al final el vector suma va des de l'inici del primer al final de l'últim.
Podem sumar tants punts com vulguem: el verd és el vector suma:
blau + vermell + violeta + taronja + cian + marró = verd
I si volem restar vectors? Per això ens serà molt útil el següent: tot vector té un oposat, el qual té el cap de fletxa a l'altre extrem. Dit d'altra manera: per fer la versió "negativa" d'un vector, simplement intercanviem cua i punta.
Un cop fet això, simplement sumem les versions negatives. Si ens demanen que fem
blau - vermell + violeta + taronja - cian + marró = verd
sempre podem reescriure-ho com
blau+ (-vermell) + violeta + taronja + (-cian) + marró = verd
de forma que ara torna a ser una suma, però amb el vermell i el cian concatenats de punta a cua en comptes de de cua a punta:
Fixem-
nos com una suma de vectors ens podria donar zero si la cua del primer
coincideix amb la punta de l'últim! Això és exactament el que passa, per
exemple, quan els vectors són forces i la situació és estàtica
(d'equilibri).
1.2. Notació, mòdul i vector unitari
Recordem que els segments es podien etiquetar amb una lletra, normalment minúscula. Aquí farem el mateix amb els vectors, però afegirem una petita fletxa a sobre de la lletra per remarcar que són vectors. Per exemple, un vector amb nom "a" l'escrivim com
També
podeu trobar llocs on en comptes de posar una fletxa a sobre, el vector
s'indica com la lletra a però en negreta, és a dir, que .
També hi ha qui decideix no posar ni fletxes ni negretes, però per fer
això cal dominar molt bé què s'està fent en cada moment, i no és el més
recomanable per a una persona principiant.
Si volem sumar dos vectors "a" i "b" escrivim
i una resta seria
O també a + b per la suma i a - b per la resta.
Ara bé, i si ens interessa només el mòdul del vector, és a dir, la llargada del segment, sense tenir en compte cap direcció o sentit? Això és perfectament raonable, ja que moltes vegades volem saber simplement això: la magnitud del vector. De fet, en anglès, el mòdul d'un vector es diu magnitude of a vector. En aquest cas, per a un vector hi ha diverses formes d'escriure el seu mòdul. Una molt utilitzada és rodejar el vector de dues barres verticals
tot i que la forma més senzilla és simplement escriure la lletra sense la fletxa, és a dir,
Aquesta darrera notació és molt natural, ja que en el fons hem reduït el vector a un simple segment.
I si ens interessa només la direcció i sentit del vector, sense parar atenció al seu mòdul? Això també és molt útil en moltes situacions. En aquest cas, acostumem a dibuixar un vector que tingui la mateixa direcció i sentit que el vector original però el dibuixem amb una longitud igual a 1. A aquest vector li direm el vector unitari d', i l'escriurem amb un barret al damunt en comptes d'una fletxa:
Al següent dibuix veiem un vector
amb un cert mòdul (en aquest cas més gran que 1), i a sobre seu posem
el seu unitari, que tindrà la mateixa direcció i sentit però amb mòdul
1:
Si el mòdul d' fos més petit que 1, la seva versió unitària (amb barret) seria més gran que la seva versió amb fletxa.
1.3. Multiplicació de vector per escalar
Acabem
de veure que podem modificar la longitud d'un vector sense canviar ni
la seva direcció ni el seu sentit. De fet, això gràficament correspon a
fer un canvi d'escala del
vector. Algebraicament, un canvi d'escala d'un vector s'aconsegueix
multiplicant un vector per un nombre normal i corrent, que pot ser un
enter, racional, real, etc... A aquest nombre que multiplica a un vector
i que el fa canviar d'escala li diem escalar.
A la figura següent veiem com podem duplicar l'escala d'un vector simplement multiplicant-lo per un escalar que no és més que el número 2:
Podríem també dividir un vector per un escalar? És clar que sí: de fet, dividir entre 2 un vector seria el mateix que multiplicar-lo per 1/2:
I si multipliquem per un escalar negatiu? Aleshores ja no només farem un canvi d'escala sinó que també farem una reflexió, és a dir, mantenint la direcció, canviem el sentit. Veiem un exemple de multiplicar per (-1) un vector. El mòdul seguirà sent el mateix, i la direcció també, però el sentit canviarà:
De fet, si suméssim aquests dos vectors, què obtindríem?
És important fixar-se en que hem dibuixat una fletxeta a sobre del zero! No és el mateix un escalar que un vectorial! Un zero escalar seria un número que de fet correspondria a col·lapsar un vector en un punt!
També podem multiplicar per -2, on ampliarem el mòdul al doble i canviarem el signe:
1.4. Vector = mòdul · unitari
Què passaria si dividim un vector pel seu mòdul? Si el mòdul és 2, dividiríem entre 2. Si el mòdul és 1/3, dividiríem entre 1/3 (és a dir, multiplicaríem per 3). En resum, el resultat final tindrà mòdul igual a 1. En altres paraules, dividint un vector entre el seu mòdul, obtenim la versió unitària del vector. Amb notació algebraica podem escriure
O de forma més elegant, qualsevol vector es pot descompondre en el producte del seu mòdul pel seu unitari:
on aquí el símbol és totalment opcional. Podríem escriure sense problema.
Aquesta
descomposició és molt important. No només perquè ens separa mòdul de
direcció/sentit, sinó perquè ens permetrà entendre moltes coses més
endavant.
1.5. Producte escalar: projeccions
Si diem "producte escalar", sembla que ens referim al producte que hem vist abans, on multiplicàvem un escalar per un vector i obteníem un vector re-escalat. Bé, el producte escalar és una altra cosa! La idea d'aquest nou producte és
(vector1)·(vector2) = escalar
És a dir, multiplicarem dos vectors i obtindrem un escalar. I en aquest cas, el símbol és imprescindible escriure'l. Per exemple, el producte escalar de dos vectors i s'ha d'escriure com .
Què vol dir aquest producte? Quin significat té aquest escalar que tenim com a resultat? Veiem-ho.
En primer lloc, i com s'ha promès abans, descompondre cada vector en el producte del seu mòdul pel seu unitari serà molt útil:
i per tant
És a dir, que el producte escalar de dos vectors és el producte senzill dels seus mòduls multiplicat per una quantitat ben estranya, . És aquesta quantitat la que hem d'entendre bé, i veurem ara com té un significat espacial molt poderós. Podem dir que és la projecció del vector sobre la direcció definida pel vector .
Què és una projecció? Suposem que volem projectar un vector (vermell) sobre una certa recta (negre discontinu):
Projectar el vector sobre la recta no és més que fer l'ombra del vector sobre aquesta recta, sempre i quan la llum caigui perpendicular a la recta.
El resultat de la projecció és el segment blau. És l'ombra que fa el vermell sobre la recta donada.
La projecció obtinguda és un segment, no un vector. Podríem dibuixar la projecció de forma vectorial també? És clar que sí:
Per tant, hi ha dos tipus de projeccions: projeccions escalars (segment) i projeccions vectorials (vector).
Tornant al nostre objecte misteriós, , veiem com el vector vermell és , mentre que la recta discontínua ve definida per (verd). I la projecció escalar és el segment blau. És a dir, que és un número, un escalar, i no un vector!
I si volguéssim que la projecció fos vectorial? Com ja tenim el mòdul, , i també la direcció i sentit, , la projecció vectorial no és més que la multiplicació d'aquest mòdul per aquest vector unitari. Recordeu que un vector sempre es pot descompondre en el producte del seu mòdul pel seu unitari:
Estem a punt de poder entendre l'objecte misteriós, el segment blau . Mirem el següent dibuix:
És
fàcil veure que el segment blau és el catet horitzontal del triangle
rectangle on el segment vermell, de longitud 1 (en aquest dibuix tot són
escalars), és la hipotenusa. Per tant,
Conclusió: la projecció d' sobre és simplement el cosinus de l'angle que formen i .
Per tant, el producte escalar de dos vectors i es pot calcular com
I si volguéssim projectar el vector sencer sobre la direcció definida per ? És fàcil de veure que aquesta projecció escalar seria
I si volem la projecció vectorial,
Reflexionem sobre dos casos extrems:
Quan els dos vectors donats són perpendiculars, no es fan ombra mútuament, i per tant el seu producte escalar és 0.
Quan, en canvi, són paral·lels, es fan una ombra màxima.
També
podràs veure que gràcies als productes escalars, les projeccions poden
ser negatives. Això què vol dir? Molt senzill: vol dir que el vector
projectat té un sentit diferent al del vector que defineix la recta
sobre la qual projectem.
1.6. Commutativitat del producte escalar
Sabem, de l'escola, que el producte entre dos escalars (que no és el mateix que el producte escalar) és commutatiu, és a dir, que
Però ara també volem veure q
De fet, ara ja podem veure fàcilment que això quedarà demostrat sempre i quan puguem veure que
Per
veure això gràficament, dibuixem una circumferència de radi 1, i dos
radis (a inclinat i b horitzontal) separats per un angle . Volem veure que les projeccions respectives (la projecció horitzontal blava i la inclinada violeta) són iguals:
Ara
ja saps prou geometria Euclidiana per veure que això és cert. Cal que
vegis que les línies verda i vermella discontínues són meitats de corda
amb angle central 2α totes dues. Per tant, tenint les dues el mateix
angle central, la longitud de les dues cordes és la mateixa. És a dir,
que les línies discontínues verda i vermella són iguals en longitud. Amb
això ja pots fer una semblança de triangles per veure que els segments
blau i violeta són iguals.
1.7. Producte vectorial: àrea
El símbol al producte escalar és molt important escriure'l, sobretot perquè existeix un altre producte entre dos vectors, que ara estudiarem, i cal no confondre'ls. Aquest segon producte es diu producte vectorial entre dos vectors, i el seu símbol és una mena de x, escrita com . Per tant, el producte vectorial d' i s'escriu com
Com ja imaginaràs, aquest producte es pot reescriure com
És a dir, que un cop més descomponem els vectors en mòduls per un costat i unitaris per l'altra. De forma que ens interessa entendre la part nova, que és . Abans hem investigat i hem acabat veient que era simplement el cosinus de l'angle que formaven els dos vectors donats. Ara podries sospitar, no serà el sinus de l'angle que formen els dos vectors? La resposta és que... sí! Però amb un matís important que veurem en breu.
Abans, hem de saber quina és la interpretació geomètrica del producte vectorial. De la mateixa forma que el producte escalar tractava sobre projeccions d'un vector sobre la direcció de l'altre, el producte vectorial tracta sobre l'àrea formada pels dos vectors.
Donats dos vectors qualsevols i , sempre podem construir un paral·lelogram amb ells
Veiem com, de fet, els costats paral·lels sempre són el mateix vector, simplement traslladat.
Quina
és l'àrea del paral·lelogram? Un cop més, hem de cridar a Euclides.
Sabem, per començar, que l'àrea d'un paral·lelogram no canvia si el
llisquem respecte dues paral·leles. Al dibuix, les àrees verda i taronja
han de ser iguals:
La base del rectangle taronja és , i ens falta l'alçada , però ràpidament veiem que
i per tant, l'àrea del paral·lelogram definit per i és simplement
tal i com havíem anticipat.
Però també havíem anticipat una subtilesa que ara hem de començar a entendre. El primer que hem d'entendre és que no és exactament el producte vectorial d' i sinó només el seu mòdul. És a dir, que
Veiem com, per un paral·lelogram, els angles són sempre entre 0 i 180º, i per tant el seu sinus no es fa negatiu.
També veiem com, si els dos vectors són paral·lels (o antiparal·lels, que vol dir amb mateixa direcció però sentit contrari), al dibuixar el paral·lelogram no podem fer-ho amb àrea més gran que 0. Només ens surt una línia sense àrea. Això és el mateix que dir que .
Fins ara només hem interpretat el mòdul del producte vectorial. Amb això ja estem dient que, al contrari que el producte escalar, el resultat de multiplicar dos vectors vectorialment és també un vector.
producte escalar = vector1 · vector2 = número = escalar
producte vectorial = vector1 x vector 2 = vector3
Ja
sabem què vol dir el mòdul del "vector3", però quina és la seva
direcció? Aquí ve la subtilesa, que surt del següent fet matemàtic: el producte vectorial només existeix en 3 i en 7 dimensions. I,
com imagineu, no tenim massa interès en fer arquitectura en 7
dimensions (de moment), així que el producte vectorial per arquitectura
només existeix en 3 dimensions.
Però clar, les figures anteriors estaven dibuixades en 2D, en un pla. I fixem-nos com dos vectors i qualsevols sempre defineixen un pla, que és al qual pertany el paral·lelogram. En tres dimensions, també podem imaginar la direcció perpendicular al pla, i és precisament aquesta direcció la que marca el resultat complet del producte vectorial.
En resum, el producte vectorial d' i es pot definir com un vector tal que
on el mòdul de , és a dir, , és l'àrea del paral·lelogram format per i , i on la direcció de és perpendicular al pla del paral·lelogram.
Hem entès bé el sentit gràfic del mòdul del producte vectorial, i també
la seva direcció. Però encara no hem entès bé el sentit d'aquesta
direcció. Ens cal aprendre més coses per poder fer-ho.
1.8. Anticommutativitat del producte vectorial
Un pla en 3D té dues cares. Cap a quina d'elles surt el vector ? De fet, quan estem dibuixant a un paper, en 2D, sempre tenim la direcció perpendicular al paper, on un sentit és cap amunt del paper i l'altre cap endins del paper.
Ja sabem que si , el vector apuntarà o bé cap el paper o bé cap a nosaltres, que mirem el paper. Però com distingim un cas o l'altre?
Al dibuix tenim dos vectors, vermell i blau, i farem el seu producte vectorial en verd.
El vector , amb un símbol d'un cercle amb una creu, indica un vector que mira cap el paper, perpendicular a aquest.
I ara fem quasi el mateix, però en aquest cas és el producte vectorial amb els vectors i canviats d'ordre:
El resultat és un vector verd amb un símbol d'un cercle amb un punt, que indica que mira cap a nosaltres, perpendicular al paper.
És a dir, que al producte vectorial de dos vectors, com , sempre hi ha un que surt primer ( en aquest cas) i un altra que surt després ( en aquest cas). veiem com per anar del primer al segon, i imaginant els vectors com a agulles d'un rellotge analògic, el moviment pot ser horari o antihorari. Si el moviment és antihorari, el vector apuntarà cap a nosaltres. Si el moviment és horari, apuntarà cap el paper. Intenta veure això als dos darrers dibuixos. No pensis en anar d' cap a , sinó del primer al segon vector del producte vectorial.
Per conveni, els angles horaris es consideren negatius, i els antihoraris positius. Això segurament ja et sona de quan calcules pòrtics i has d'introduir moments de força (o parells) al teu sistema. Si fas servir aquest convenir de signes, et pots ajudar de la mà dreta. El primer vector del producte serà el teu dit índex. El segon vector serà el teu dit mig. Finalment, el resultat del producte vectorial apuntarà on apunti el dit polze. Per fer això, òbviament, has de posar aquests tres dits de forma perpendicular. Si fas servir el signe contrari de signes, on horari és positiu, aleshores el procés és semblant però el resultat te'l donarà el polze la mà esquerra. Alguns llibres fan servir el criteri de mà esquerra, però en aquesta escola faràs servir el de mà dreta (espero!).
A la wikipedia en anglès trobem aquest dibuix clarificador:
Com
a curiositat, els sistemes que fan servir el criteri de mà dreta es
diuen dextrogirs, i els de mà esquerra levogirs. En llatí, dextra dir que està a la dreta i laevus vol dir esquerra.
Amb això completem el nostre enteniment espacial del producte vectorial! Hem vist que si canviem l'ordre de la multiplicació només canviem el signe del resultat, i per tant aquest producte és anticommmutatiu, que vol dir que només el signe es veu afectat si commutem (intercanviem) l'ordre dels vectors multiplicats. Dit d'altra manera:
1.9. Benvinguda a Descartes
Potser penses que en tota la discussió feta fins ara ens hem oblidat dels eixos de coordenades i també de les components dels vectors. Bé, no ens hem oblidat. Simplement no calien. Tot el que hem fet fins ara no necessitava l'ajuda del gran matemàtic al que ara cridem: Descartes.
Va ser ell qui va tenir la brillant idea de, a tots els dibuixos de geometria, afegir eixos de coordenades.
O també, en el seu honor, eixos cartesians. En una dimensió farem
servir un eix, al qual anomenarem eix de les x. En dues dimensions, dos
eixos, per x i y. En tres dimensions, x,y i z.
Els eixos cartesians sempre són mútuament perpendiculars. Si pintem aquests eixos al Geogebra
(un software amb una llicència força lliure que pots fer servir o bé al
teu ordinador de forma directa o bé a través d'un compte gratuït al web
geogebra.org), veiem els dos eixos x i y.
Coses importants aquí:
1) cada eix conté una recta dels nombres reals, els quals s'ordenen de forma creixent seguint una punta de fletxa (que no indica cap vector en aquest cas).
2) l'eix horitzontal s'acostuma a dir x i el vertical y, amb sentit positiu dreta i amunt, respectivament.
3) a estructures segurament feu servir H (d'horitzontal) en comptes de y i V (de vertical) en comptes de z.
4) els eixos cartesians són perpendiculars, però veurem que podem definir eixos de coordenades que no tenen per què ser-ho
5) els dos eixos s'acostumen a dibuixar amb la mateixa escala, del contrari perdem bona part de les propietats de la geometria Euclidiana. És a dir, que els eixos estan en proporció 1:1.
En 1D simplement dibuixaríem l'eix x. I en 3D? Aquest cas és més subtil, perquè un cop escollits els eixos x i y, tot i saber que l'eix z ha de ser perpendicular al pla xy, hi ha dues opcions pel sentit cap al qual creixen les z. El que farem normalment és dibuixar el pla xy i fent servir la regla de la mà dreta, amb x com a índex (fàcil de recordar perquè té una x) i amb y com a dit mig, el polze ens indicarà el sentit de les z positives. Això serà un sistema de coordenades cartesià dextrogir (del contrari seria levogir).
Si dibuixem aquests eixos al Geogebra,
En gris està dibuixat el pla horitzontal xy. I perpendicular a aquest pla tenim l'eix x, que apunta cap amunt. Si l'índex és x (vermell) i mig és y (verd), la z és polze, cap amunt (blau). Aquests colors segueixen els sistema RGB (Red-Green-Blue), per així recordar bé l'ordre.
Fixem- nos que en dues dimensions només hi ha un pla, el xy, mentre que en tres dimensions hi ha tres plans molt especials, que són el xy, el xz i el yz. Cadascun d'aquests plans conté dos dels eixos cartesians.
En
aquesta assignatura farem servir el criteri de que el pla xy és el pla
horitzontal, mentre que z el marca l'acceleració gravitacional (amb
sentit contrari a la gravetat, és a dir, cap amunt).
1.10. Vectors i coordenades
Abans de res, hem de dir una cosa molt important. Si ens pregunten "què és un vector?", la resposta mai ha d'estar relacionada amb els eixos. Podeu dir que un vector és un segment entre dos punts on s'indica un sentit. O qualsevol altra definició que no contingui eixos ni coordenades ni components ni res que no haguem fet ja. Això és important perquè és fàcil, un cop introduïts els eixos, deixar-se emportar pel seu encís i creure que són aquests els que defineixen un vector. Això no és així. Ja has vist que els hem dibuixat fins ara sense eixos, i no hem tingut cap inconvenient.
Dit això, dibuixem ara uns vectors amb eixos. I a més, introduirem una quadrícula com a ajuda (no cal dibuixar-les si no volem):
El vector vermell, diem que és fixe perquè la seva cua neix a l'origen de coordenades, punt que habitualment anomenem O. En canvi, el vector blau, , és lliure
perquè està ancorat (té la seva cua) a un punt que no és O. A l'estudi
mecànic/estructural et trobaràs vectors tant lliures com fixes. Per
exemple, un vector posició sempre serà fixe, ja que es refereix a
l'origen de coordenades. En canvi, un vector de força és lliure perquè
ha de tenir la cua dibuixada exactament al punt on es pateix
la força. (Curiositat: A moltes arquitectes els agrada lliscar els
vectors de força, però compte perquè això només és cert per objectes
rígids. Molt millor que les cues dels vectors de força estiguin als
punts de patiment.)
Els
vectors indiquen un camí que va des de la cua fins la punta. Per tant,
cada vector té un un punt inicial i un punt final. D'aquesta manera, el
vector també es pot escriure com el vector , i el vector com .
Com ens referim a un punt concret? Per exemple, el punt A. Diem que el punt A té coordenades (3,2) perquè per anar de l'origen O fins a A cal caminar 3 unitats horitzontals i caminar 2 unitats verticals.
Molt important: el punt A és el mateix que el vector . Dir simplement "punt A" és una mena de forma resumida de dir "vector . Quan parlem de posicions de punts, es sobreentén que el punt de la cua és l'origen O.
L'origen de coordenades té components (0,0), ja que és el vector i per tant cal moure's 0 unitats tant en horitzontal com en vertical.
Quines serien les coordenades del punt B? Pensem que B és el mateix que , i per tant, tenim (4,2). De la mateixa forma, les coordenades del punt C o bé del vector són (6,1).
Sempre posarem les coordenades separades per comes i tot entre parèntesis.
Quines serien les coordenades del vector (lliure) ? Per anar del punt B al punt C cal moure's dues unitats a la dreta i una unitat cap abaix. Per tant, (2,-1).
Fixem-nos també que sempre es pot construir un vector de la següent forma, si coneixem els seus punts inicial i final:
vector = (punt final) - (punt inicial)
Per exemple, el vector seria el mateix que C - B, i per tant (6,1) - (4,2) = (6-4,1-2) = (2,-1).
Fixa't com, per sumar o restar vectors, cada component (x,y o z) és un canal totalment independent. Sumem o restem les x amb les x, les y amb les y i les z amb les z.
Si tenim i , la suma es fa així
i la resta així
Aquesta és la forma de sumar i restar vectors a través de les seves components.
1.11. Els vectors canònics
Qualsevol vector defineix una recta a la qual pertany, com ja vam veure a l'hora de definir la recta de projecció. Per tant, els eixos x, y i z, sent rectes, es poden definir amb uns vectors als quals diem vectors canònics.
En 2D, el vector canònic que defineix l'eix x es diu i té coordenades (1,0). El vector que defineix l'eix y es diu i les seves coordenades són (0,1).
En 3D, els eixos x,y,z es defineixen amb els vectors canònics
També us els podeu trobar com
Els vectors canònics sempre són unitaris.
Dibuixem un cas 2D. Veiem com els vectors canònics defineix cadascú el seu eix.
Si abans dèiem que el punt A, o el vector té coordenades (3,2), era només una forma compacta de dir que per anar d'O fins a A hem de fer una cadena de 3 vegades i dues vegades .
O expressat com a suma de vectors:
.
Aquesta darrera forma d'escriure un vector pot semblar una mica farragosa i no tan neta com les components entre parèntesis. No obstant, és una forma molt més profunda i resulta clau per entendre temes més avançats.
Com i són els vectors que caracteritzen els eixos (afegim per treballar en 3D), diem que aquests vectors són una base definida per aquests eixos. i és més: com els vectors són els canònics, aquesta base es diu base canònica.
Hem vist que qualsevol vector al pla xy es pot escriure com la suma de unes quantes vegades el vector més unes quantes vegades el vector . Dit d'una altra manera: si tots els vectors del pla es poden construir com "n vegades més m vegades " (on n,m són dos nombres reals qualsevol), podem concloure que i són els dos "ingredients" fonamentals per construir qualsevol vector. Només cal saber quant posem d'un ingredient i quant posem d'un altre (i les quantitats poden ser negatives). En definitiva, una base és una col·lecció mínima d'ingredients amb els quals podem construir tot un cert "espai", que aquí és el pla xy.
És fonamental que vegis aquesta forma d'escriure un vector. Repetim,
.
Fixa't en la forma d'aquestes expressions:
vector = (número_x)·(vector_x de la base) + (número_y)·(vector_y de la base)
que es podria traduir en termes casolans com:
objecte_construït = (quantitat de l'ingredient_1)·(ingredient_1) + (quantitat de l'ingredient_2)·(ingredient_2)
on a la col·lecció d'ingredients {ingredient_1, ingredient_2} li diem base, i a la col·lecció de "quantitats de cada ingredient" li diem "components del vector", i l'escrivim com (quantitat d'1, quantitat de 2).
Sempre han d'estar en ordre "cíclic" i, j, k o bé j,k,i o bé k,i,j (quan arriba la k, torna a començar per la i).
1.12. Descartes i Pitàgores
Si ens fixem en el dibuix anterior,
cada vector és una espècie d'hipotenusa on els catets estan formats per col·leccions de vectors canònics.
Si escrivim per components,
i .
Per tant, els mòduls d'aquests vectors seran simplement les hipotenuses!
i .
Fixem-nos en la següent relació de conceptes. És molt important:
Hipotenusa = mòdul
Catet horitzontal = component x
Catet vertical = component y
1.13. Diferents bases
Com hem dit abans, un vector té una realitat profunda, definida pel seu dibuix sense necessitat d'eixos i per tant sense necessitat de components.
Un mateix vector pot ser a la vegada analitzat amb dos bases diferents, cada base definint un conjunt d'eixos diferent. Anem a veure un exemple per un vector , el qual mirarem amb eixos canònics (definits per i i també amb dos eixos no canònics, definits per dos vectors i , els quals no tenen per què ser unitaris, ni tenir mòduls iguals () ni per què ser perpendiculars (tot i que en aquest dibuix els hem posat perpendiculars):
Fixa't com es pot expressar com "3 vegades més dues vegades , però també viatgem des d'O fins a A si fem "2 vegades més 4 vegades ". Dit d'una altra manera, amb la base formada per i , les coordenades d' són (4,2), mentre que amb la base formada pels eixos grisos, és a dir, pels vectors i , les coordenades del mateix vector hem definit prèviament la base. Un mateix vector té infinites formes diferents d'escriure les seves components. Però el vector, la fletxa vermella, sempre és la mateixa!
Veiem un altre cop com podem escriure (atenció a l'estructura):
vector = (número_x)·(vector_x de la base) + (número_y)·(vector_y de la base)
Per la base canònica:
i per la base no canònica
Fixem-nos en que a les dues equacions surt , per tant
Conclusió: hi ha infinites formes d'anar un punt (O) a l'altre (A). I sempre es pot fer com a combinació de dos tipus de pas que poden ser desiguals entre sí i no necessàriament perpendiculars (tot i que no poden ser paral·lels!).
1.14. Re-escalar un vector
Abans ja hem vist com es re-escalava un vector gràficament. Ara cal fer-ho amb components. Si tenim un vector i el volem duplicar, fem . Si el volem canviar de sentit, fem .
I amb components? Si tenim
aleshores
i
És a dir, si un escalar multiplica (o divideix) per fora del vector, cal que aquest número operi sobre totes les components del vector. Si el vector l'escrivim amb vectors de la base (per exemple, la canònica),
aleshores
El re-escalat de vectors, com veurem, és una de les dues operacions fonamentals dels espais vectorials.
1.15. Producte escalar, segona part
Ja coneixem aquest producte i el seu significat geomètric. No obstant, si treballem amb components, també tindrem una capacitat de càlcul molt més avançada. Considerem els vectors:
Quin és el seu producte escalar? Bé, podríem dibuixar-ho, calcular els mòduls, mirar de mesurar l'angle que formen... però no cal. Hi ha una forma molt més fàcil, quan tenim les components:
O en general,
Això
sona una mica a recepta màgica. En canvi, si fem servir l'expressió més
profunda per vectors, veiem que té sentit. Ho fem en 2D per no calcular
massa (en 3D és similar però més llarg, i no cal):
Si multipliquem tot això tenim
però tot això es simplifica molt, ja que i , i per tant,
De totes formes, continua semblant una recepta prou màgica. Per poder entendre-ho gràficament, és convenient pensar en el producte , ja que sabem que els mòduls només fan que re-escalar problema. També sabem que aquest producte escalar equival al on és l'angle que formen els dos vectors.
Només cal fer un dibuix on els dos vectors apuntin cap a un mateix radi igual a 1, ja que són unitaris. Per fer-ho encara més senzill, i sense perdre generalitat, podem alinear amb l'eix horitzontal, de forma que ens queda
Sabem que, gràficament, és l'ombra d'un sobre la direcció de l'altre, i per tant aquí és simplement . Per components, seria , però com , tenim que el producte escalar és .
Si dibuixéssim el vector de forma no alineada amb un eix, el dibuix es complica una mica més però la idea és equivalent.
1.16. Producte vectorial, segona part
El producte vectorial es calcula de la forma següent per components:
Novament, sembla una recepta màgica. Per entendre-ho cal dibuixar-ho. I no cal fer un dibuix en tres dimensions! Això ve donat perquè, com ja vam dir abans, dos vectors qualsevol formen un pla, o sigui que podem directament dibuixar i sobre el pla que formen.
I per complicar-nos la vida encara menys, definim l'eix x com aquell que conté i l'eix z com el perpendicular al pla. Amb totes aquestes simplificacions, sabem que el producte vectorial ha de donar , on ja que i . Si ho dibuixes, veuràs que és la base del paral·lelogram i la seva altura, i per tant obtenim l'àrea de la figura, que és el que el producte vectorial (en mòdul) dona.
Per dibuixar el cas complet la idea és semblant però una mica més elaborada.
Encara no hem parlat de determinants, però potser ja saps fer-los, i en aquest cas,
Aquest és un bon moment per introduir, ni que sigui sense justificació, com es calcula el volum d'un paral·lelepípede, que és la versió 3D d'un paral·lelogram. Si bé un paral·lelogram l'originen dos vectors i , un paral·lelepípede l'originen tres vectors , i .
Sin ens donen un paral·lelogram i els vectors són bidimensionals, aleshores l'area és
Si ens donen els dos vectors amb coordenades tridimensionals, aleshores simplement fem el mòdul del producte vectorial.
I si volem el volum del paral·lelepípede? Farem això:
Tant per com per podríem haver posat els vectors en columnes en comptes d'en files i els resultats serien els mateixos.
2. Equacions lineals
En aquest capítol explorarem el concepte de linealitat i les equacions lineals que podem trobar.
2.1. Equacions i variables
Una igualtat o identitat és un parell d'expressions matemàtiques enfrontades per un signe =, que vol dir que els dos costats de l'equació són iguals. Per exemple,
Aquí, 2+1 és una expressió, i també ho és 5-2. Per sí soles no representen una igualtat, però quan tenim el signe = al mig sí.
Una equació és una identitat a la qual surten símbols que no coneixem. A la identitat anterior sortien 4 números, tots coneguts, per tant no és una equació. En canvi,
sí que ho és, ja que no sabem, inicialment, quant val x. Solucionar l'equació vol dir trobar quant val x. En aquest cas,
seria la solució. Dins de l'equació, a tot símbol sobre el qual no sabem el valor li diem variable. Normalment, a matemàtiques i física fem servir les lletres per variables espacials, pel temps, per variables enteres, per nombres primers, etc, però això no és en absolut obligatori.
Les variables són com unes capses on a dins cap un número, que encara no sabem quin és.
A una mateixa equació podem tenir diferents variables, per exemple
i això vol dir que no podrem solucionar el valor de les dues variables només amb una equació.
Una equació, per tant, és una condició que tot valor de les variables que apareixen han de complir. Pot ser que existeixi més d'un valor d'x pel qual l'equació es satisfà. Per exemple,
En aquest cas, tant com satisfan la condició. Diem que l'equació té dues solucions.
Les condicions no tenen per què mostrar igualtats. També poden fer servir desigualtats, com ara
Aquests símbols, representen desigualtats.
2.2. Rectes
Abans d'entrar en rectes inclinades cal revisar el concepte de rectes horitzontals i verticals. Són les més senzilles però a vegades ens poden crear confusió.
En 2D, els dos eixos de coordenades són l'eix x i l'eix y. L'eix x és tot aquell conjunt de punts pels quals y=0, i per tant, l'equació d'aquest eix és precisament y=0. Pot donar lloc a confusió, perquè sent l'eix x, és la lletra y la que apareix! De forma equivalent, l'eix de les y té com a equació x=0.
Tota recta horitzontal té com a equació y=constant. Exemples: y=2, y=-1, y=0.
Tota recta vertical té com a equació x=constant. Exemples: x=2, x=-5, x=0.
Pot
resultar confús llegir "x=2" i pensar que és una recta. A primera
vista, x=2 és simplement una equació que ens diu que el valor d'x és 2.
Això és cert, i i visquéssim a un món amb una sola dimensió, marcar x=2
seria marcar un punt en aquesta dimensió. Fi de la història. Però si
vivim a dues dimensions, hi ha molts punts que tenen valor x=2. Per
exemple, el punt (2,0), o el punt (2,3) o el (2,-80). Tots els punts
(2,y) són possibles per x=2, i per tant, escriure "x=2" en 2D equival a
dir que tenim una recta.
Però
atenció perquè x=2 a 3D no voldrà dir una recta! Si a l'espai
tridimensional només diem "x=2", estem restringint només una de les tres
dimensions possibles, i per tant això seria l'equació d'un pla. Com
expressaríem l'eix de les x en 3D? Una forma seria escrivint y=z=0.
L'eix de les y seria x=z=0. L'eix de les z seria x=y=0. I una recta
qualsevol paral·lela a l'eix x? Per exemple, y=2;z=-1. Necessitem dues
equacions! Una recta qualsevol paral·lela a l'eix y seria, per exemple,
x=-3;z=5.
Val molt la pena que juguis a escriure equacions a algun programa com ara geogebra i experimentis.
Típicament, a l'escola s'aprèn que l'equació d'una recta en 2D s'escriu de diverses formes, sent una d'elles, segurament la més popular, aquesta:
on és el tall de la recta a l'eix vertical (ja que y=n quan x=0) i on és el pendent de la recta. El pendent és un concepte molt important i que cal tenir clar. Dibuixem unes rectes d'exemple:
Tenim tres rectes: la verda, la blava i la vermella. Per la verda, el tall a l'eix vertical és , per tant tenim . A la blava, el tall és , i a la vermella .
Les rectes verda i blava són descendents (sempre s'entén que avancem horitzontalment cap a la dreta, i per tant, o bé ascendim o descendim). Això vol dir que les seves pendents són negatives. En canvi, la recta vermella és ascendent i tindrà pendent positiva. A més, les rectes verda i blava són paral·leles, i això vol dir que tenen la mateixa pendent. Per finalitzar amb els pendents, direm que l'eix x (horitzontal), té pendent nul·la o 0, mentre que l'eix vertical té pendent infinit.
Quines equacions tenen aquestes rectes? Ja sabem les seves , però ens falta conèixer els pendents. Per calcular-los de forma senzilla ens fixem en dos punts que siguin fàcils a cada recta. A la verda, A i B; a la blava, C i D; i a la vermella, E i F.
Per entendre el pendent introduïm un símbol molt útil: (la Delta majúscula del Grec). La fem servir per voler dir "increment". Quan tenim, per exemple, una x inicial i una x final a un segment i volem dir quin és l'increment d'x, escrivim
increment d'x = xfinal - xinicial =
Quan els increments són molt petits, tant que tendeixen a 0, en comptes d'escriure escrivim .
Un cop això, ja podem definir què vol dir el pendent:
pendent = increment pujat o baixat respecte l'increment avançat
O dit matemàticament,
pendent =
O de forma més detallada,
on i,f volen dir inicial i final.
Sempre assumim, com ja hem dit, que avancem cap a la dreta, i per tant es pren positiu.
Sabent tot això, i fixant-nos en els punts marcats, podem calcular els pendents del dibuix:
# verda, on A=(0,0) i B=(-1,-1). Veiem clarament que . És a dir, descendim 1 quan avancem 1.
# blava, on C=(0,2) i D=(2,0). Veiem que . No calia perquè la blava és paral·lela a la verda, però està bé per practicar.
# vermella, on E=(0,-2) i F=(5,0). Per tant, .
I per tant, les equacions seran
verda:
blava:
vermella:
No obstant, a pesar de tot el que hem dit aquí, aquesta no és la forma més poderosa d'entendre una recta, i queda especialment clar quan anem a tres dimensions, tot i que de moment seguirem amb 2D.
La forma més poderosa d'escriure una recta ve del següent fet: qualsevol vector contingut a la recta serà perpendicular a un vector perpendicular a la recta. És tan obvi que sembla absurd escriure-ho amb paraules! Però intentem expressar-ho matemàticament.
Abans
d'això, refresquem la perpendicularitat en 2D. Si tenim un vector
(2,1), com poder construir un vector perpendicular a aquest? Molt
senzill: intercanviem les components i canviem el signe a només una
d'elles. Quina? La que vulguem. Clarament hi ha dues opcions: (1,-2) i
(-1,2). Tots dos vectors són perpendiculars el vector inicial donat. En
general, per un vector (e,f) donat, si construïm el vector (-f,e) o
(f,-e) i fem el producte escalar amb el vector inicial obtenim ef-fe=0, o
bé -ef+fe=0.
Un
cop sabem això, tornem a les rectes. Com podríem expressar un vector
qualsevol que estigui contingut a la recta? Imaginem que sabem un
punt pel qual passa la recta, per exemple en punt . A més, podem assegurar que tots els punts de la recta tindran coordenades . Per tant, si fem la resta entre el punt genèric i el punt P, tindrem un segment que sempre estarà dins de la recta.
Abans d'escriure aquest vector, una mica de notació. Normalment, per escriure un vector de posició fem servir la lletra , de forma que la posició del punt P és el mateix que expressar el vector , i també el mateix que escriure .
Per tant, el vector que volem construir sobre la recta es pot escriure com a
on recordem que vol dir increment. Per tant,
O més desenvolupat encara,
És a dir, que és un vector que va des del punt P conegut fins a qualsevol altre punt possible de la recta.
D'altra banda, suposem que coneixem un vector perpendicular a la recta, al qual anomenarem . La n de "normal", que és un sinònim de perpendicular. Per tant, és un vector normal a la recta. Fixem-nos que si és normal a la recta, també ho és.
Un cop sabem això, tenim clar que i són perpendiculars, i per tant,
,
que és, amb diferència, la millor forma d'entendre una recta. Ho mostrem a aquest dibuix:
El punt (x,y) pot estar a qualsevol punt de la recta, i P és el punt donat.
Exemple: escriu l'equació d'una recta que passa pel punt P=(2,3) i que té com a vector normal el .
Escrivim i per tant,
Es pot reescriure això com
o encara més simplificat,
És a dir, que serà molt convenient escriure les rectes d'aquesta forma genèrica:
on són nombres qualsevol.
Si ens donen la normal a la recta i també un punt d'aquesta, és convenient construir les rectes així.
I si en comptes d'això ens donen l'equació directament? Per exemple,
Com interpretem aquesta recta? Primer de tot, podem veure ràpidament que (4,3) és un vector normal a la recta. En canvi, no és tan fàcil interpretar què vol dir el 2, ja que és el resultat de multiplicar escalarment el vector normal per un punt per on passa la recta. Però quin és aquest punt? Pot ser qualsevol!
En aquest cas, el més recomanable és imaginar el punt més fàcil de tots: aquell perpendicular a la recta que passa per l'origen.
Mirem
d'entendre aquestes dues rectes. Cadascuna té definit un vector normal,
i per tant, per a totes dues rectes podrem escriure . Però com podem saber l'altra part, per la blava i
per la vermella? El truc consisteix en triar el P i Q més intel·ligents
possibles: quan el vector de posició de P o Q queda alineat amb el
vector normal, de forma que el producte
passa a ser simplement la distància OP multiplicada pel mòdul d'n. Per
la vermella, serà la distància OQ pel mòdul d'n i també per un (-1), ja
que el vector i són antiparal·lels.
Tornem a la recta , on sabem ja que un possible és el (4,3). Ara també sabem que el 2 ha de ser el producte de i la distància perpendicular de l'origen a la recta, que podem anomenar d. Per tant 2=5d i aleshores d=2/5=0.4.
Anem al Geogebra i directament (no cal aillar la y) escrivim i obtenim (el vector normal el dibuixem en versió unitària perquè si no es feia massa gran al dibuix):
Tot aquest procés pot semblar excessiu per entendre una recta, però té els seus fruits, com veurem a la següent a continuació.
2.3. Plans
En
3D tenim tres eixos de coordenades (xyz) i per tant hi ha tres plans
molt importants. El pla yz que l'escriurem amb l'equació x=0. El pla xz,
amb equació y=0. I el pla yz, amb equació x=0. També podem escriure
plans com x=2, que serà paral·lel al pla yz. O y=-2, que serà paral·lel
al pla xz.
Si has seguit tot el que hem explicat sobre les rectes, ara tindràs un fruit per recollir: en 3D, per escriure l'equació d'un pla, fem exactament el mateix procés.
Si ens donen un vector perpendicular al pla, i un punt P que passa pel pla, ja tenim tot el que volem. En aquest cas, és el vector que uneix P amb un punt genèric del pla (x,y,z). I per tant, és un vector contingut al pla, i com a tal ha de ser perpendicular a . Això ens permet escriure l'equació del pla:
o més desenvolupada
A la imatge, P i el punt genèric (x,y,z) pertanyen al pla (blau amb quadrícula). El vector que els uneix (en verd) és i està contingut al pla. Per tant, és perpendicular al vector normal al pla, , en violeta.
Si ens donen directament l'equació del pla,
,
sabrem extreure un vector normal i també el seu mòdul . Per tant, el significat del número és el producte de per la distància de l'origen al pla. Si fos negatiu, simplement voldria dir que el vector normal que ens donen és antiparal·lel al vector , sempre que triem P de forma intel·ligent i sigui la distància de l'origen al pla.
Amb això ja pots tenir un control total sobre els plans! I també sobre els hiperplans en 4D!
I si volguéssim tenir una recta en 3D? Ens serviria aquest mètode? Compte perquè mentre que a 2D una recta només té una perpendicular, a 3D no queda determinada amb només una. Calen com a mínim dues perpendiculars. És a dir, necessitaríem bàsicament definir dos plans no paral·lels, i l'equació de la recta que resulta de la intersecció dels dos plans serà l'equació de la recta. Tan senzill com això.
2.4. Sistemes de rectes
Tot aquest coneixement adquirit fins ara ens permet mirar aquesta equació
i
en comptes de pensar "és una equació" dir "és una recta". I a més,
(a,b) és perpendicular a la recta i per tant (b,-a) i (-b,a) són
paral·lels a la recta.
I si ens donen aquest sistema de dues equacions?
Podem dir immediatament que són dues rectes paral·leles perquè els vectors normals que salten a la vista, (3,2) i (6,4), són paral·lels. Però a més veiem que podem dividir tota la segona equació per 2 i obtenim la primera equació. És a dir, hem escrit dues vegades la mateixa recta!
Però una cosa subtil aquí: ens han dit que allò era un sistema d'equacions. Per tant, hem de dir quins valors de x i y satisfan aquest sistema. Això és equivalent a dir a on es tallen les dues rectes! Per tant, la solució és molt fàcil, perquè sent la mateixa recta repetida, es tallen a tots els punts de la seva recta, i per tant hi ha infinites solucions, que corresponen a tots els punts de la recta.
Un altre exemple:
Ara les dues rectes són paral·leles, però veiem que els termes independents, 1 i 3, no guarden la mateixa proporció que els altres nombres. Per tant, les rectes són paral·leles i no es tallen mai. No existeix cap solució!
Un altre exemple:
2.5. Sistemes de plans
Ara ens donen el següent sistema d'equacions:
Immediatament hem de pensar en que tenim dos plans. En aquest exemple, extraiem els seus vectors normals i veiem que són paral·lels, cosa que farà que els plans també siguin paral·lels. A més, veiem que el terme independent segueix la mateixa proporció que la resta de nombres, per tant és el mateix pla, i tenim infinites solucions: tots els punts del pla.
Un altre exemple:
Ara els dos plans són paral·lels però els termes independents tenen una proporció diferent. Per tant, són plans paral·lels i no existeix cap solució.
Un altre exemple:
Ara
els plans no són paral·lels, i per tant serà obligatori que es tallin
en una recta. Quina? Una forma molt ràpida de dir quina recta podria ser
"la donada per aquestes dues equacions". I seria una resposta
perfectament correcta! una altra opció seria fer servir el mateix mètode
d'abans (Gauss), on ja comencem escrivint a dalt la fila que més ens
interessa,
I ara comencem a buscar 0's a sota/esquerra. Multipliquem per 2 i restem la de sota a la de dalt:
La fila de sota ens diu que z=1. Per tant, la fila de dalt ens dirà que
o bé
Aquesta darrera equació,
NO és l'equació d'una recta! L'hauríem d'acompanyar de l'altra equació,
z=1. Però al cap i a la fi hem donat dos equacions de plans, com abans,
o sigui que no hem guanyat massa. Sí hem guanyat en poder imaginar la
recta, ja que podem fitar el pla z=1 com una pantalla on després
dibuixar la recta 2x+4y=-2 com si fos en el pla xy.
Els tres plans són el mateix pla. Hi ha infinites equacions.
En aquest cas, distingim que els dos primers plans són el mateix, i que aquest pla no és paral·lel al tercer. Per tant, la solució ha de ser una recta.
Un altre exemple:
Aquí, el primer i segon plans són paral·lels i no es tallen. Però el tercer pla no és paral·lel i per tant tindrem dos rectes de tall, la que fa el tercer tallant al primer i la que fa el tercer tallant al segon. Això vol dir que no hi ha cap punt que pertanyi a la vegada als tres plans, i per tant, no hi ha cap solució. Fixa't bé en aquest concepte: un punt solució ha de pertànyer a tots els objectes donats a la vegada.
Un altre exemple:
Aquí és obvi (buscant els vectors ) que no tenim cap pla paral·lel a un altre. Per tant, podríem pensar, el primer tallarà al segon fent una recta, i aquesta recta tallarà al tercer pla en un punt, que serà la nostra solució. INCORRECTE! El primer pas sí és correcte: els dos primers plans, no sent paral·lels, es tallaran en una recta. Però atenció, perquè aquesta recta podria ser paral·lela al tercer pla!!!!!
Com poder saber això sense que ens calgui calcular la recta i comparar amb el pla? Novament, el mètode de Gauss, però també es pot fer a ull. Fixem-nos com la tercera equació és en realitat la suma de la primera més 4 vegades la segona. Si ja ho veus així, el teu mètode pot ser aquest:
1) comparar dos plans i veure que no són paral·lels
2) mirar que el tercer pla no sigui una combinació lineal dels dos altres plans.
Què vol dir combinació lineal? Ja ho vam veure en capítols anteriors. Quan el tercer pla és combinació lineal dels altres dos,
(tercer pla) es pot escriure com n·(primer pla) + m·(segon pla)
Aplicant el mètode de Gauss a aquest exemple, la darrera fila es convertiria en una fila de tot 0's. Això què voldria dir geomètricament? Que la recta fruit de la intersecció entre els dos primers plans pertany al tercer pla. Per tant, tenim infinites solucions, donades per l'esmentada recta.
Què passaria si tenim aquest altre exemple?
Quasi tot és igual ara, excepte que el tercer pla no és exactament una combinació lineal dels dos primers. Però quasi, perquè el vector del tercer pla sí que és una combinació lineal dels dos primers! Això vol dir, espacialment, que el tercer pla és paral·lel a la recta, però aquesta no està continguda en el pla. Si fem mètode de Gauss, a la darrera fila obtenim
que es tradueix a , cosa que és incorrecta, i que ens diu que no hi ha cap solució al sistema d'equacions.
Un últim exemple
Aquí veiem que els dos primers plans no són paral·lels, i veiem que el tercer no és una combinació lineal dels altres dos. En cas de dubte, hi ha un mètode que no falla: Gauss.
Així que i podem continuar amb la segona fila per obtenir y, i finalment la primera per obtenir x.
És a dir, que una cosa és trobar la solució, i una altra cosa, sovint molt diferent, és veure quantes solucions hi ha, si és que hi ha, i quina forma tenen. Moltes vegades ens demanaran el segon, i per tant no caldrà trobar les solucions, només saber si existeixen o no, i d'existir, quina forma tenen.
Un
mètode ràpid per veure si els tres vectors normals són linealment
independents, és a dir, si el pla que formen dos d'ells no és paral·lel
al tercer, és fer un determinant posant els tres com a files o com a columnes. Encara no sabem per què això és cert, però val la pena mirar-ho. Pel darrer exemple:
En canvi, pels altres exemples, aquest determinant donarà 0. Per tant, si feu primer de tot aquest determinant:
1) si dona voldrà dir que existeix solució única.
2) si dona 0, pot ser que existeixin infinites solucions (que poden ser un pla o una recta) o bé que no existeixi cap.
2.6. Linealitat
Totes les equacions de la forma
on a,b,c,d,...,k són constants, es diuen equacions lineals.
En 1D, representen un punt. En 2D, representen una recta. En 3D, un pla.
Les equacions lineals són fonamentals per a l'arquitectura. En particular, totes les operacions que farem amb elles, és a dir, tota l'àlgebra lineal, és la base de la manipulació de l'espai tridimensional. És impossible, per exemple, entendre les operacions que fan possible el dinamisme del software 3D (jocs, disseny,...) sense una comprensió profunda de l'àlgebra lineal.
Als propers capítols estudiarem de què tracta aquesta àlgebra i com funciona.
3. Espais vectorials
En
aquest capítol introduirem un concepte fonamental per poder fer àlgebra
lineal: els espais vectorials. Als apunts oficials de l'assignatura
tens una aproximació rigorosa a aquest tema. Aquí simplement intentarem
construir una mica d'intuïció, de forma que els apunts esmentats siguin
encara més profitosos.
3.1. Espais 1D
Imagina que et trobes al punt i que et proposen un repte a fer caminant sobre el pla xy. Et donaran dues cartes:
carta 1) ingredients: et defineixen els tipus de pas que podràs realitzar caminant
carta 2) normes: et defineixen com pots modificar i combinar els passos donats a la carta 1
Per exemple:
carta 1) només podràs fer passos tipus (1,0), és a dir, en la direcció marcada per aquest vector
carta 2) podràs modular l'escala dels passos permesos a la carta 1, i a més podràs fer tants com vulguis.
És a dir, que (sempre sortint del (0,0)), pots fer passos tipus (1,0), (0.5,0), (-3.2,0), etc. I fer tants com vulguis. Quan acabis de fer-los, et quedaràs en una posició i la marcaràs.
El repte és dir: fins a quins punts pots arribar amb aquestes regles? La resposta en aquest cas és ben clara: puc arribar a qualsevol punt de l'eix x, que és una recta.
I si l'únic pas permès fos el (1,2)? Com el pots modular (re-escalar), i els pots sumar (i restar), podràs arribar, si surts del (0,0), a qualsevol punt de la recta que passa pel (0,0) i amb pendent 2.
Una altra forma de dir aquest repte és: si saps la recta que defineix l'únic pas permès, hi ha alguna forma de, siguis on siguis dins d'aquesta recta, escapar d'aquesta? La resposta és que no pots escapar d'aquesta recta.
D'alguna manera, l'espai definit per les regles del repte és una mena de "presó" pels vectors que viuen a dins. Una presó de la qual no podran sortir mai si l'únic que tenen permès és re-escalar-se i sumar-se i restar-se entre ells.
Aquesta presó de vectors s'anomena un espai vectorial que podem etiquetar amb una lletra majúscula, per exemple .
Al conjunt d'operacions que pots fer per intentar escapar (sense èxit) de la presó es diu combinació lineal. És a dir, que una combinació lineal de, per exemple, tres vectors , i (els tres han de ser presos a l'espai vectorial ), consisteix en primer re-escalar cada vector (multiplicant-lo per un escalar que pot ser negatiu si volem), i un cop tinguem els tres re-escalats els sumem (la resta no cal dir-la perquè queda inclosa amb suma de negatius). El resultat d'aquesta operació seria, si els números que re-escalen els vectors són ,
I si veritablement és un espai vectorial, aquest nou vector que han creat en equip els altres tres, ha de pertànyer també a la presó. El vector es diu que és una combinació lineal d', i .
En resum, un espai vectorial és una presó de vectors on, si intenten escapar fent combinacions lineals d'ells mateixos, no poden escapar.
Els
espais vectorials unidimensionals són, espacialment, rectes. Poden
viure en 1D, 2D o 3D, però sempre seran rectes. Per exemple,
és un espai vectorial vivint en . El símbol vol dir "els nombres reals". Si l'escrivim amb exponent 2, vol dir l'espai real de 2 dimensions. I vol dir l'espai de 3 dimensions.
Dins , qualsevol recta també serà un espai vectorial unidimensional. Per exemple:
és una recta, i per tant un espai vectorial unidimensional que viu a . Aquesta forma d'escriure una recta no l'havíem fet servir fins ara. En general s'escriu
i vol dir "una recta que passa pel punt i paral·lela al vector . A l'exemple, el punt P seria (-3,2,0) i .
Per acabar aquesta secció, introduïm una notació matemàtica molt comuna. Per exemple:
Aquesta igualtat es llegeix com " és el conjunt de tots els punts tal que es compleix que .
En primer lloc, fixem-nos que el costat dret està envoltat per claus {}. A matemàtiques, quan envoltem entre claus, volem dir "el conjunt de...".
En segon lloc, la barra vertical | (que també es pot escriure inclinada, com /), vol dir "tal que...".
És a dir, que definim un conjunt de punts amb nom , i per això primer diem que són "el conjunt de" punts tridimensionals "tal que" compleixen una o més condicions. Després del | podem posar tantes equacions o condicions com vulguem.
Exercici: donar la base de l'espai definit per .
Simplement necessitem donar un vector que sigui paral·lel a aquesta recta, i que per tant la defineixi. Podem escriure
Fixa't en les claus, que volen dir "el conjunt de tots els vectors definits com a combinació lineal del vector que hi ha dins".
3.2. Espais 2D
Hem vist que quan ens donaven només un tipus de pas, la nostra "presó" era una línia recta de la qual no podíem sortir només fent combinacions lineals de passos que pertanyin a ella. Ara afegim una dimensió més, i per tant, ens donen dos tipus de pas que podem fer.
Un exemple molt fàcil i molt important: ens diuen que podem fer només dos tipus de passos: (1,0) o (0,1). O si volem, i . Aquests passos els podem re-escalar tant com vulguem i sumar-los entre ells. Recorda que has de sortir de l'origen de coordenades!
Fins a on pots arribar amb aquest joc? La resposta és fàcil: a tot , és a dir, a tot el pla xy. Sabem que les coordenades de qualsevol vector que surti del (0,0) i que arribi a un punt qualsevol (x,y) són precisament (x,y). La part important és que (x,y) es pot reescriure com
La darrera forma d'escriure-ho sempre serà la més profunda, perquè ens separa amb claredat els ingredients, i de les quantitats d'aquests ingredients, x i y. A més, aquesta darrera expressió té la forma d'una combinació lineal dels vectors i i per tant ens recorda que el resultat, el vector (x,y), sent una combinació lineal dels dos vectors ingredient, no podrà escapar de la presó definida per ells.
Per tant, amb dos passos permesos que no siguin paral·lels (ja que aleshores un seria una combinació lineal de l'altre), sempre tindrem definit un espai vectorial de dues dimensions, o geomètricament un pla. Aquest pla, si estem a , serà ell mateix, però a podem definir molts plans diferents, i cadascú d'aquests serà un espai vectorial de dues dimensions.
Un exercici interessant: ens donen un pla i ens demanen quins són els ingredients que el defineixen.
En primer lloc, hem de dir que hi ha moltes possibilitats per aquests ingredients. Sabem que han de ser dos, i que no han de ser paral·lels. I els dos han de pertànyer al pla.
Mirant l'equació del pla veiem que un possible vector normal és . Ara fem un truc força comú, que consisteix en inventar-se un vector que sigui perpendicular a aquest (i que per tant serà paral·lel al pla). Recordeu que en 2D, per fer un perpendicular a (a,b) fèiem (b,-a) o (-b,a)? Doncs aquí fem el mateix per dues components, les que siguin, i la tercera la fem 0. Si ens donen el vector (a,b,c), un possible perpendicular seria (a,-b,0). Comproveu que el producte escalar de tots dos dona 0.
Per tant, proposem el vector com a paral·lel al pla. I també proposem, fent el mateix procés però ara permutant la primera i tercera component de , .
Tots dos vectors pertanyen al pla donat (són paral·lels a ell) i a més
no són paral·lels entre sí. Per tant, qualsevol vector que pertanyi al
pla es podrà escriure com a la combinació d'aquests dos vectors! Si a,b
són dos nombres qualsevol,
on necessàriament ha de pertànyer al pla.
En termes més tècnics, direm que una possible base per l'espai definit pel pla és
Noteu com els hem posats entre claus. Amb aquesta notació entenem "el conjunt de vectors que es poden formar com a combinacions lineals d'aquests dos vectors".
3.3. Espais 3D
Podríem
aquí explicar el mateix que als espais 2D però pujant tot una dimensió.
No és tan interessant aquest cas per arquitectura, perquè el màxim
nombre de dimensions que tindrem és 3, i per tant, un espai vectorial
tridimensional serà sempre .
Cert que podem tenir molts espais vectorials tridimensionals diferents si anem a , però això aquí ara no ens interessa massa.
És ja obvi que la base , és a dir, la base canònica, és la més senzilla per definir els tres ingredients mínims que necessitem per construir tots els vectors de . Sabem que qualsevol vector (que surti de l'origen) amb coordenades (x,y,z) es pot reescriure com a combinació lineal d'aquests tres ingredients:
Però
podríem triar una base que no fos la canònica! L'única condició que han
de complir els tres vectors d'una base tridimensional és que els tres
siguin linealment independents. Per tant, si fem el determinant 3x3 dels
tres vectors proposats, hem d'obtenir un resultat . Si obtenim un determinant serà una base vàlida. Si obtenim un determinant no serà una base vàlida.
Exercici: doneu una base de diferent a la canònica.
Primer pas: ens inventem un vector qualsevol: (1,1,0)
Segon pas: triem un segon vector que no sigui paral·lel al primer: (0,1,1)
Tercer pas: necessitem un tercer vector que sigui linealment independent dels altres dos. Podríem anar provant a l'atzar i fent el determinant, però una forma més directa és trobar el producte vectorial dels dos primers, que ens donarà un vector que és perpendicular al pla format per ells, i per tant, aquest resultat, no pertanyent al pla, no serà combinació lineal d'aquests dos primers vectors.
Solució: una possible base és .
Això vol dir que qualsevol vector de es podrà escriure de la forma
És a dir, que el mateix vector pot tenir components (x,y,z) en base canònica i components (a,b,c) en la base proposada. És natural que si canviem els ingredients (la base), també canviïn les quantitats que hem de posar de cada ingredient (les components). I podríem fins i tot escriure:
Per fer-ho més senzill, en comptes de donar un vector
genèric (x,y,z), donem un vector particular, (2,3,1) en base canònica.
Quines serien les components en la nova base? Podrem escriure (posant
també números als vectors canònics)
Quantes incògnites tenim aquí? Tres: a, b i c. I quantes equacions tenim? Una equació, però és una equació vectorial amb 3 components: això equival a tenir 3 equacions que es poden escriure per separat si volem:
(1)
(2)
(3)
O
sigui, que tenim tres equacions amb tres incògnites. Entre parèntesi
hem numerat les equacions, una pràctica molt habitual i que és molt
útil. Podem, per exemple, restar (2) - (3) i obtenim a=2. Això, aplicat a
(1) ens dona que c=0. I finalment, (2) ens dona b=2. Per tant,
(a,b,c)=(2,1,0). Podrem escriure com a conclusió final (i per comprovar
que tot és correcte):
Conclusió: el vector que en base canònica té components (2,3,1), en la nova base que hem trobat té components (2,1,0). Intuitivament, el que hem fet és triar un conjunt de tres ingredients diferents (els vectors de la base), i el que hem trobat ara és quina quiantitat de cada ingredient hem de posar per poder "cuinar" el mateix vector . Recorda que el vector mai canvia, encara que les seves components sí! El vector és la fletxa que dibuixaríem a un gràfic, i serà la mateixa encara que dibuixem eixos diferents.
3.4. Subespais vectorials
Un subespai vectorial té un significat molt clar, des del punt de vista intuïtiu: si un espai vectorial és una "presó" de vectors on, per molt que els presos intentin combinar-se linealment per construir un vector que escapi a la presó, mai ho podran aconseguir, un subespai vectorial és la mateixa idea, però es defineix com una "sub-presó", és a dir, com una presó dins de la presó. A dins d'una presó sempre hi ha zones de reclusió de fet, com per exemple un calabós. És important remarcar que per tal que la sub-presó sigui realment una sub-presó, qualsevol combinació lineal dels vectors que estan dins de la sub-presió mai podrà escapar d'aquesta.
Geomètricament, és molt obvi que si tenim un pla, podem definir una recta que estigui continguda en aquest pla. En aquest cas, el pla seria un espai vectorial i la recta seria un subespai vectorial d'aquest pla. Si pugem una dimensió, és un espai vectorial, i dins d'aquest podem definir un pla. Aquest pla serà un subespai vectorial d'. I res no ens impedeix definir una recta dins de , en comptes d'un pla, i també serà un subespai vectorial d'aquest.
En resum:
1) una recta és un subespai vectorial d'un pla que la conté, i també de l'espai .
2) un pla és un subespai vectorial de .
3.5. Formalisme
4. Matrius i bases
En
aquest capítol introduïm a un dels objectes més importants de l'àlgebra
en general: les matrius. I les relacionarem amb un altre concepte
fonamental: les bases.
4.1. Matrius com a màquines
Una
matriu es pot entendre com una màquina que rep un input i que emet un
output. Gràficament es pot representar una matriu M de la següent
manera:
Aquesta matriu està esperant rebre un input per poder emetre un output:
Què són els inputs i els outputs? La resposta és senzilla: són espais vectorials.
És molt important que les dimensions dels espais vectorials input i output no tenen per què tenir la mateixa dimensió. Quan sabem una mica més sobre matrius veurem que si la matriu és quadrada, aleshores input i output sí tindran la mateixa dimensió. Si no és quadrada no.
Des d'un punt de vista pràctic, la matriu és una màquina a qui donem de "menjar" un vector que pertany a l'espai vectorial input, i "escup" un altre vector que pertany a l'espai vectorial output.
Però aquest diagrama és una mica enganyós, perquè en realitat una matriu actua sobre un vector des del costat esquerre del vector:
(Matriu)·(vector input) --------> (vector output)
Com podem veure en aquest esquema, una matriu opera sobre un vector multiplicant a aquest per l'esquerra del vector.
Aquest esquema permet veure que podríem aplicar tantes matrius com vulguem sobre un vector. Imaginem que volem aplicar una matriu M1, després (l'ordre és important) aplicarem M2, i després M3. Aleshores, la forma d'ordenar-les és:
(M3)·(M2)·(M1)(vector input) ---> (vector output)
Fixa't
com les matrius fan "cua" per poder operar sobre el vector. M1 opera
sobre el vector input. M2 opera sobre el resultat de (M1)·(vector
input), que serà un vector (un output parcial). M3 opera sobre el
resultat de fer (M2)·(M1)·(vector input), que també és un vector, un
output parcial.
4.2. Descripció d'una matriu
Un exemple de matriu M es pot escriure com
Aquesta matriu es diu una matriu 3x3, que vol dir que té tres files (horitzontals) i tres columnes (verticals). En aquest cas, com el nombre de files i columnes és el mateix, la matriu és quadrada.
Un exemple de matriu no quadrada seria
la qual tindria dues files i tres columnes. Per tant, aquesta matriu és una matriu 2x3, i no és quadrada.
Veient aquest números, 2x3, entenem que els vectors input pertanyen a un espai vectorial de dimensió 3 i els vectors output pertanyen a un espai vectorial de dimensió 2.
En general, una matriu mxn indica que té m files i n columnes, i que pren com a input vectors de dimensió n i produeix vectors de dimensió m. Com a forma de recordar-ho:
m x n = files x columnes = (dimensió output) x (dimensió input)
Una altra cosa molt important: Els vectors sempre els hem escrit amb les components ordenades de forma horitzontal. Per exemple, . Aquesta forma d'escriure'l és molt còmoda, sobretot a l'hora d'escriure en text, com aquest text mateix. No obstant, quan hi ha matrius que volen operar sobre un vector, els vectors s'han d'escriure en forma de columna. Per exemple, si el vector té a prop una matriu del que serà input o output, l'escriurem com a
Per tant, si multipliquem una matriu per un vector input (x,y,z) (és a dir, si operem la matriu sobre el vector), i obtenim com a output un vector diferent (x',y',z'), haurem d'escriure
El punt és opcional.
En el cas d'una matriu no quadrada, podem escriure
Veiem en aquest cas com clarament els vectors input són tridimensionals però els vectors output són bidimensionals.
Finalment, a la matriu
els elements a, e, i es diuen els elements de la diagonal, i la resta, els elements no diagonals. A més, la traça de la matriu M, escrit com Tr(M), es defineix com la suma dels elements de la diagonal
Veurem que la traça d'una matriu, junt amb el determinant i el rang, són els tres números que no canvien a pesar de canviar de base.
4.3. Multiplicacions amb matrius
Necessitem saber com actua una matriu sobre un vector. La recepta és ben senzilla:
Cada fila de la matriu fa un producte escalar amb el vector input, i dona com a resultat un número que és una component del vector output.
Expressat de forma més formal, si tenim
hem de pensar la fila de dalt com un vector (a,b,c), la fila del mig com un vector (d,e,f) i la fila de sota com un vector (g,h,i). Aleshores fem els següent productes escalars:
També hauràs d'aprendre (pel teu compte) a multiplicar dues matrius. Per exemple,
i aprendre a veure que el resultat no és el mateix que el producte
El que sí és fàcil és multiplicar una matriu per un escalar. Només cal multiplicar el número per totes les components de la matriu. O vist al revés, si totes les components tenen el mateix factor multiplicant, es pot treure factor comú:
Compte perquè això no és cert amb els determinants! És una font d'error molt comuna. Encara que no haguem explicat determinants encara, tenim que
etc.
En general, per cada fila o columna on hi ha un factor comú, surt el
factor comú fora. O si ha d'entrar un escalar, només entra a una fila o
columna.
4.4. Sistema d'equacions lineals
És molt important veure la relació que hi ha entre aquesta equació matricial (equació on surten matrius)
i aquest sistema d'equacions lineals
on considerarem que a,b,c,d,e,f,g,h,i,x',y',z' són números i x,y,z són variables. Hem de veure que aquestes equacions són exactament el mateix que el que hem expressat abans de forma matricial. Per tant, són dues formes equivalents de veure un mateix problema. Sempre, un sistema d'equacions lineals tindrà una matriu associada.
Per resoldre el sistema, per exemple, per trobar x,y,z a
hi diferents formes:
1) construir la matriu i aplicar reducció de Gauss.
2) resoldre amb substitucions, igualacions, etc.
3) trobar la matriu inversa, si existeix.
Què vol dir això de la matriu inversa? Una matriu pot tenir (o no) una matriu inversa que anomenem . La gràcia d'aquesta matriu és que, quan multiplica a o és multiplicada per M, obtenim una matriu identitat . Molts conceptes nous!
La matriu identitat es pot també escriure com o per aclarir si ens referim a 2D o 3D, respectivament. En concret,
Aquesta matriu té la propietat de que produeix un vector output exactament igual al vector input. És una màquina que no fa res!
Per tant, si multipliquem o bé , és com si apliquéssim una màquina que fa una cosa i després una altra màquina que desfà el que l'altra ha fet. El resultat d'això és equivalent a no fer res, per tant
Per tant, si existeix la matriu inversa, i si tenim
podem multiplicar tota l'equació per la matriu inversa, i multipliquem per l'esquerra:
i per tant, a l'esquerra, obtenim , que es com no posar res, i per tant,
que ens donaria la solució (un cop tenim la inversa).
Si no saps fer inverses de matrius, hauràs d'aprendre pel teu compte. A la Khan Academy
trobaràs moltes explicacions (molt bones i tot allà és gratuït) sobre
com fer-les. Aquí només mencionem que una matriu es pot invertir quan és
quadrada i quan el seu determinant no és 0.
Fixem- nos que, treballant amb matrius, no és el mateix multiplicar per l'esquerra que multiplicar per la dreta. Si tenim dues matrius i , no és el mateix fer que . Diem que el producte de matrius no és commutatiu.
4.5. El paper de les matrius
Hem vist que una matriu és una màquina que transforma un vector (d'un espai vectorial input) en un altre vector (d'un espai vectorial output). Per cert, en comptes de dir input o output també podem dir espai origen (input) i espai imatge (output).
Suposem que tenim un vector
(taronja) que, com ja sabem, té entitat pròpia, independent de
qualsevol base. Ara bé, si el dibuixem sota coordenades Cartesianes
canòniques, amb la base canònica (dibuixats en rosa), les seves coordenades seran .
És a dir, que tot i que els vectors taronja i els roses són vectors, tenen un caràcter una mica diferent. El vector taronja és un vector que simplement viu a l'espai, i no l'importa si canviem de base (és a dir, d'eixos). Ell seguirà sense immutar-se com la fletxa taronja que és. D'altra banda, els vectors roses són vectors que tenen un paper molt clar: definir la base, o també podem dir que defineixen els eixos de coordenades.
El
vector taronja és independent de qualsevol base, però si volem escriure
unes coordenades per ell, necessitem una base. Per tant, a nivell de
coordenades, aquestes depenen dels vectors roses. És a dir, que d'alguna
manera, el vector taronja viu a l'espai, mentre que els vectors roses
defineixen com és l'espai, o com a mínim, com es mesura l'espai. Els
roses defineixen l'espai i el taronja representa un objecte que viu a
l'espai. Per simplificar, podem dir que si canvien els roses estarà
canviant l'espai, mentre que si canvia el taronja estarà canviant
l'objecte que viu a l'espai.
Aquesta distinció és important perquè si ara ens donen una matriu i la volem aplicar a algun vector, ens preguntem, sobre quin vector o vectors aplicar-la? Hi ha dos opcions. Molt important poder distingir-les:
cas
1) Una opció és aplicar-la només sobre el vector taronja. Aleshores
direm que la matriu està canviant els objectes que viuen a un espai
determinat pels vectors roses, però aquest espai no canvia, només
canvien els objectes que viuen a ell. En aquest cas, la matriu serà una
matriu que no canvia la base però sí canvia els vectors que viuen a la
base. Imagineu que definiu l'espai a partir d'uns eixos marcats per les
cantonades entre dues parets i el terra. I teniu una taula en aquella
habitació. El que farà la matriu aquí és deformar o moure la taula,
deixant les parets i el terra tranquils. De forma gràfica, tenim això:
El vector taronja ha passat de ser (4,3) a ser el (3,4). Els vectors roses es queden igual, perquè no ha canviat l'espai, sinó només els objectes que viuen a l'espai. Si tens curiositat, la matriu que transforma un en l'altre és
I de fet aquesta transformació no és més que una rotació (respecte l'origen) antihorària d'un cert angle.
cas 2) L'altra opció és aplicar-la als vectors roses. Aleshores direm que la matriu està canviant l'espai on viuen els objectes (com el taronja). En aquest cas la matriu serà una matriu que deixa iguals als objectes però que canvia els vectors de la base. Serà una matriu de canvi de base. A l'habitació d'abans, deixaríem la taula tranquil·la, i el que canviaria serien les línies que definirien el terra i les parets, és a dir, les nostres referències.
Gràficament,
ara apliquem una transformació sobre els vectors que defineixen els
eixos, deixant tranquils als objectes (taronja) que viuen a l'espai
sense definir eixos.
Després de la transformació, en comptes de tenir una base , tenim una base
Important: NO hem aplicat la mateixa matriu al vector taronja al cas 1) que als vectors roses al cas 2). En aquest exemple, al cas 1) hem aplicat una rotació antihorària, i al cas 2) hem aplicat una matriu semblant, que fa girar els vectors roses el mateix angle, però de forma horària.
Què volem il·lustrar amb això? Que en el fons, girar de forma antihorària un angle el vector taronja és equivalent a girar els eixos de forma horària el mateix angle. Al cas 1) hem girat l'objecte i al cas 2) hem girat la referència amb la qual mesurem l'objecte.
Les equacions matricials seran:
Podríem intentar calcular quantes vegades necessitem i quantes vegades necessitem per poder construir el vector taronja. És a dir, quines són les components (x',y') del taronja a la nova base. Podem escriure que
Això són dues equacions, amb les quals es pot fer un sistema i trobar que
Conclusió: modificant el vector taronja, passem d'un vector (4,3) a un (3,4). La base sempre és la mateixa. Però si deixem el vector taronja tranquil i modifiquem la base de forma inversa al que vam fer amb el taronja, tenim que el mateix vector taronja és (4,3) en la base antiga i (3,4) en la base girada.
En
general, podem o bé transformar les bases o bé transformar els vectors
que viuen a l'espai. O podríem fins i tot fer les dues coses! Segurament
ja t'has trobat amb dualitats semblant estudiant física. Per exemple,
si veus passar un tren des del terra, a tu et sembla que el tren es mou,
però per les persones que van en el tren, ets tu qui es mou. És
equivalent moure físicament un objecte o moure la referència sobre la
que es mesura l'objecte.
4.6. Matriu de canvi de base
Centrem-
nos primer en el cas 2) de l'apartat anterior, on ens dediquem a canviar
els vectors de la base. En concret, anem a canviar de la base canònica B
a la base nova B'.
Seguint el mateix exemple d'abans, hem passat d'una base a una base .
En aquest cas, la matriu que ens permet canviar de base ha sigut
ja que (com vam veure abans)
Anomenem a aquesta matriu , on indica "canvi de base" i els subíndex indiquen "canvi de la base B cap a la base B'.
No
pensis que la inversa d'una matriu sempre consisteix en intercanviar
els elements de la diagonal. En aquest cas és cert, però no és cert en
general.
4.7. Les columnes de la matriu
Segurament ja t'has fixat en quin significat geomètric tenen les columnes d'una matriu. Reescrivim una equació de l'apartat anterior per poder-ho remarcar:

I si ens donen aquesta matriu?
Només mirant les columnes, veiem que el vector de la quadrícula es queda igual, mentre que el vector passa de (0,1) a (1,1). Això dibuixat correspon a
El que hem fet és una cisalla a l'espai! La nova quadrícula, de la qual només hem dibuixat una cel·la (en vermell discontinu), estarà formada per paral·lelograms iguals que el dibuixat.
I l'àrea de la nova cel·la de la quadrícula? Gràcies a Euclides pots veure fàcilment que amb una cisalla tampoc canvia.
Anem a veure un darrer exemple, on l'àrea sí que canvii. Proposem la matriu
Només mirant la matriu ja sabem com fer la nova quadrícula, i aquí mostrem com:
Amb la quadrícula gris és fàcil veure l'àrea de la nova cel·la, si la pensem per triangles i ajuntem aquests per construir un quadrat i un rectangle. En total tenim àrea igual a 3. En aquest cas, per tant, no només es modifica la forma de les cel·les de la quadrícula, sinó que també canvia la seva àrea.
Per concloure aquest apartat, podem fer una llista de punts clau (alguns nous i altres no):
1) Una transformació lineal és equivalent a multiplicar per una matriu on totes les components són números constants (si la matriu té elements com ara o la transformació serà no lineal.
2) Una transformació lineal aplicada a una base (és a dir, a com mesurem l'espai amb una quadrícula) modifica la quadrícula de forma que
a) l'origen s'ha de quedar a l'origen
b) les cel·les de la nova "quadrícula" (entre cometes perquè ja no estarà, en general, formada per quadres), es deformaran en paral·lelograms. les línies de la quadrícula nova han de continuar sent rectes i paral·leles entre elles.
4.8. Determinant
Potser ja saps com es calcula un determinant, que sempre ha de ser d'una matriu quadrada. En 2D,
i en 3D
Si això no ho tens clar, ves a la Khan Academy on trobaràs vídeos molt bons on ho explica. De fet, allà està meravellosament explicada tota l'àlgebra lineal!
Això era un resum de com es calcula, però... què és un determinant? Quin significat espacial té?
Tornem als exemples de l'apartat anterior. Al primer exemple teníem
i per tant, el seu determinant és
i el dibuix era
Hem dit que l'àrea de la cel·la de la nova quadrícula era igual que l'àrea de la cel·la de la quadrícula antiga, per tant
(àrea cel·la nova) / (àrea cel·la antiga) = 1
Aquest valor coincideix amb el determinant. Casualitat? Veiem el segon exemple, que tenia una matriu de cisalla,
amb determinant
El determinant és
Per tant, té tota la pinta de ser certa la nostra sospita. Posem'ho en negreta perquè és cert:
(àrea cel·la nova) / (àrea cel·la antiga) = det(P)
4.9. Matrius de transformació lineal
Ja hem vist que una matriu transforma vectors, i que podem aplicar-la o bé als vectors de la base, on diem que "transformem l'espai" o bé als vectors que viuen a l'espai. La discussió en tots dos casos és ben semblant, però cal tenir clar quan parlem de canviar de base i quan parlem de canviar els vectors de l'espai.
Quan parlem de transformar els vectors de base, les matrius les anomenarem (i la seva inversa). Quan parlem de transformar vectors que viuen a l'espai (deixant tranquils als vectors de la base), les matrius les anomenarem com (també farem servir la seva inversa).
Ara ens centrarem en modificar vectors de l'espai, deixant els eixos iguals. I com és una mica lleig gràficament parlant dibuixar els vectors de posició que uneixen l'origen amb cada punt que volem canviar, per què no dibuixar només els punts de destí, sense dibuixar les fletxes? Recordem que quan parlem d'àlgebra lineal, tots els vectors es considera que surten de l'origen, i per tant sabem que la transformació ha de deixar l'origen sense transformar.
Dibuixem una figura qualsevol:
Aquest "arbre" blau està format per una sèrie de punts: A,B,C,D,E,F,G i H. Si ara volem deformar aquesta figura (l'espai queda igual, la quadrícula no es modificarà), simplement hem de multiplicar una matriu de transformació a cadascun dels vectors de posició, que aquí són vuit. Per exemple, apliquem la cisalla
Dibuixem en vermell la figura obtinguda (mantenint la blava per comparar):



4.10. Alícia i Berta
L'Alícia i la Berta són dues estudiants d'arquitectura que ens ajudaran a entendre una de les dues situacions més difícils tant en l'àlgebra com en la vida mateixa: posar-se al lloc d'altra persona i entendre com la mateixa realitat es veu diferent amb altres ulls.
Considerem
que tot el que hem fet fins ara s'ha fet des del punt de vista de
l'Alícia. Ella és qui us ha dibuixat totes aquestes gràfiques perquè són
com ella les veu. Per exemple, a la figura l'Alícia ens mostra tal i
com ella veu un vector i ens mostra també els eixos canònics tal i com ella els veu:
Ara ve la Berta i diu "ei, que jo també existeixo i tinc uns eixos!". Aquests són els eixos definits per la base . L'Alícia diu "d'acord, veig els teus eixos i els pinto en gris discontinu. Entenc que els teus eixos estan girats horàriament respecte els meus":
L'Alícia,
per descomptat, diu "la base canònica és la meva". Tu, Berta, que ets
una altra persona, tens una base no canònica." Segurament sabeu que
"canon" ve del Grec κανών (kanon) que vol dir "regla" o "norma". Per tant, aquella persona que fa el dibuix diu que lo seu és lo canònic.
Però l'Alícia és una persona empàtica, i ha reconegut l'existència de la Berta i dels seus eixos. I amb molt d'ànim, es proposa desxifrar el vector (al qual no l'importen ni l'Alícia ni la Berta, ell viu tan feliç en un espai sense quadrícules que són fruit de la imaginació) amb la base de la Berta. L'Alícia diu "tu, Berta, per poder construir el vector , no pots fer combinacions lineals d' i , perquè no és la teva base. El que necessites és fer servir els teus vectors de base, i . Mentre que jo, per construir , necesito 4 vegades i 3 vegades , tu deus necessitar vegades i vegades . Però quant valen i ?"
L'Alícia fa càlculs, i també prova gràficament d'encaixar una resposta. De fet, nosaltres ja hem resolt aquest problema fa una estona. L'Alícia troba la solució, que nosaltres ja sabíem:
L'Alícia diu "D'acord, per fer el vector taronja, jo necessito fer els passos marcats en violeta, mentre que tu, Berta, necessites seguir els passos marcats en vermell. En concret, jo necessito (4,3) passos segons els meus eixos, i tu necessites 3 vegades i 4 vegades , és a dir, que les coordenades del vector sota la teva base són (3,4), mentre que per a mi són (4,3)."
El resum de la visió de l'Alícia és aquest (ja l'hem escrit altres vegades, però és molt important):
on les tres expressions igualades són
(el vector ) = (el que jo, Alícia, veig amb la meva base) = (el que tu deus veure, Berta, amb la teva base)
I per fi, la Berta, que havia estat callada i escoltant, decideix parlar, i diu: "Això últim que has dit no és cert! La última expressió no és el que jo, Berta, veig, sinó el que tu creus que jo veig!"
L'Alícia respon: "ostres, jo he intentat ser tan empàtica com he pogut, però sembla que no ho he encertat. Explica'm tu què veus!"
La Berta, amb un somriure, el primer que diu és: "per començar, la meva base és la canònica, no la teva! Tu sí que ets no canònica!"
L'Alícia, òbviament, no està d'acord, i comencen a discutir. Però com són dues persones intel·ligents acaben entenent-se. L'Alícia diu: "si ho en entès bé, totes dues veiem lo nostre com canònic, i allò que és d'altra com no canònic." La Berta diu que està d'acord, que sembla que és així. "Però - diu l'Alícia - com ens podrem entendre?" La Berta diu: "deixa'm que jo et dibuixi les coses tal com jo les veig i després parlem".
Així que la Berta comença a dibuixar els seus eixos (canònics sota el seu punt de vista), i també el vector tal i com ella el veu en realitat. Mentre el dibuixa, la Berta observa una cosa molt important. Diu "és curiós, Alícia, perquè a l'últim dibuix que has fet, no has posat números als eixos. De fet, el podries haver dibuixat sense cap eix". L'Alícia, sorpresa, esborra els eixos del seu darrer dibuix i diu: "així?"
La Berta respon: "Exactament. Això és el que tu veus sense cap eix, ni eixos teus ni eixos meus. I en aquest dibuix, igualment tu pots dir que necessites, per construir , 4 vegades i 3 vegades , i també veus que jo necessito 3 vegades i 4 vegades . Jo crec que aquesta deu ser una veritat que no pot canviar massa en el meu dibuix."
"No t'acabo d'entendre", diu l'Alícia. La Berta respon: "Fixa't, tu has escrit
però això es dedueix del dibuix sense eixos. Tinc la sensació de que jo arribaré a la mateixa conclusió." L'Alícia diu "Segueixo sense entendre-ho. Fes el teu dibuix i ho parlem."
La Berta diu: "D'acord, aquí tens el meu dibuix. He mantingut el color taronja pel vector , el color violeta pel camí que tu fas per construir el vector i el color vermell pel camí que jo segueixo per construir el vector. He posat primes a les meves etiquetes, per diferenciar-les de les teves, tot i que crec que no calia. Aquí tens el que jo veig. Els eixos Cartesians, canònics, són els meus. Els eixos rotats, grisos, discontinus, són els teus."
L'Alícia
diu "Ui, quin embolic. No els podríem veure els dos junts? Seria més
fàcil per comparar." I així ho fan. Cadascuna signa el seu i el
comparen:
El primer que diu l'Alícia és "Tenies raó! Si ignorem eixos i quadrícules, està clar que el teu meu camí (violeta) per construir necessita 4 vegades el meu primer tipus de pas i 3 vegades el meu segon tipus de pas! I el teu camí (vermell) necessita 4 vegades el primer tipus de pas i 3 vegades el segon tipus de pas! Què interessant!"
"Sí, diu la Berta, però com veus, jo veig les coses diferents de tu en el dibuix." El resum del que veu l'Alícia era
I el resum del que veu la Berta és
Les dues troben una forma sorprenent d'escriure això:
= 4·(1r vector Alícia) + 3·(2n vector Alícia) = 3·(1r vector Berta) + 4·(2n vector Berta)
4.11. Alícia i Berta, 2a part
Les dues estudiants es tornen a trobar per acabar d'entendre com les matrius actuen sobre els vectors i sobretot, com es relacionen els diferents punts de vista que té cadascuna.
"Alícia - diu la Berta -, crec que, per no embolicar més la cosa, hem de dir quina de nosaltres és la canònica i quina és la no canònica. Per ser pràctiques. Encara que sabem que cadascuna es veu com a canònica a sí mateixa. Al cap i a la fi, no farem sempre els dos dibuixos."
Arriben a l'acord que la base de l'Alícia és la canònica i la de la Berta és la no canònica. És a dir, decideixen situar-se al punt de vista de l'Alícia. A més, a la base canònica l'etiquetaran amb la lletra i a la base no canònica amb la lletra .
"Crec
que hauríem de repassar breument el que vam fer l'altre dia abans de
fer la part nova." diu l'Alícia. I tornen a escriure les conclusions a
les que van arribar, però ja fent servir les etiquetes B i B'. A més,
tots els vectors vists a B no porten prima i els vectors vists a B' sí
porten:



5. Aplicacions lineals
En aquest capítol explorarem les aplicacions lineals.
Què és una aplicació? Es pot entendre com una màquina que rep un input i dona un output com a resposta. Ja hem vist que les matrius són unes aplicacions, perquè tenen un vector com a input i donen un vector com a output. Una altra aplicació pot ser una funció com les que ja has vist al batxillerat. Per exemple, f(x)=x² és una aplicació que té com a input un número i com a output dona el número al quadrat. Exemples: f(2)=4, f(3)=9, f(-2)=4.
Què vol dir que l'aplicació sigui lineal? Primer de tot, considerem dos inputs i1 i i2, pels quals la nostra màquina ens donarà com a outputs o1 i o2, respectivament. Amb aquests dos outputs podríem fer una combinació lineal, és a dir, multiplicar cadascun per un número diferent (a per o1 i b per o2) i sumar els dos resultats:
a·o1 + b·o2
Podríem obtenir aquest mateix resultat, a·o1 + b·o2, si a la màquina li donéssim a·i1 + b·i2 com a input? Si la resposta és que no, la màquina serà una aplicació no lineal. Si és que sí, serà lineal.
Vist amb aplicacions com a matrius, tant els inputs com els outputs seran vectors, i podrem escriure:
a·M·i1 + b·M·i2 = M·(a·i1 + b·i2)
Amb una funció f podem escriure
a·f(i1) + b·f(i2) = f(a·i1 + b·i2)
Anem a veure un exemple amb matrius. Considerem la matriu M
Siguin els inputs els dos vectors
Per tant, els outputs seran els vectors
Ara podem multiplicar l'output 1 per 3 i l'output 2 per -1. Els resultats els sumem i obtenim
Ara mirem si obtenim el mateix resultat donant com a input la combinació lineal dels inputs (amb els mateixos números multiplicats). Primer construïm l'input que volem:
Ara li donem aquest input a la màquina, i obtenim
Per tant, obtenim el mateix resultat. En general
Són totes les matrius aplicacions lineals? No! Però sí ho seran sempre que les components de la matriu siguin números. A la matriu d'exemple tot eren números, i per tant era lineal. Si ens trobem amb components que són funcions en comptes de números, l'aplicació podria ser no lineal. En aquest curs, totes les matrius seran lineals.
Veiem un exemple amb funcions. És f(x)=x² lineal? Investiguem-ho. Donem com a inputs els números i1=2 i i2=3. Multipliquem, com abans, els inputs per 3 i per -1 respectivament. Obtenim
I ara mirem si amb l'input 3·i1-1·i2, és a dir, 3·2-1·3=3, obtenim el mateix resultat:
Veiem que NO obtenim el mateix resultat. Per tant, l'aplicació f(x)=x² no és lineal. Provem ara amb f(x)=2x+1. Fem com abans, i comparem
amb
De forma que aquesta aplicació tampoc és lineal. Provem ara amb f(x)=2x:
amb
5.1. Transformació lineal de l'espai
Una transformació lineal pot, per tant, aplicar-se a tots els punts de l'espai i donar una versió deformada/transformada/modificada de l'espai. Una transformació no lineal també pot transformar l'espai. Per tant, hem d'entendre espacialment, què vol dir que l'espai s'ha transformat linealment. S'han de complir dues condicions per dir que un espai transformat ho ha fet linealment:
1) l'origen es manté a l'origen
2) totes les línies rectes continuen sent línies rectes
Una
altra forma de veure això és pensant amb la quadrícula (o malla) amb la
que mesurem l'espai. Si comencem amb una malla quadrada de costats 1,
com es transforma la malla? S'han de complir dues condicions (a més de
la condició de que l'origen ha de mantenir-se a l'origen):
1) Les línies que eren paral·leles a la malla antiga continuen sent paral·leles a la malla nova.
2) Les cel·les de la nova malla continuen equi-espaiades.
O dit d'una altra forma: els quadrats de la malla inicial esdevenen paral·lelograms.
Tot
això que ja sabíem per matrius, ara sabem que aplica a tota
transformació lineal. Com veiem, sembla que les matrius que són
aplicacions lineals i les funcions que són aplicacions lineals tenen
molt en comú. Explorem aquest punt.
5.2. Matrius i funcions
Posem que ens donen la matriu
Com les quatre components són números, la matriu és una aplicació lineal. Ara bé, podríem escriure una funció f que, com a màquina, ens proporcionés el mateix servei? Ha de ser una funció f que menja vectors, i per tant, la podem escriure com a f(x,y), ja que en aquest exemple la matriu menja vectors 2D. Si mengés vectors 3D, la funció seria f(x,y,z). Però encara hem d'escriure la forma de la funció. Com ho fem? Mirem de donar de menjar el vector (x,y). Veiem que ens dona
Per tant, com l'input és (x,y) i l'output és (x-y,2y), podem escriure
on sempre seguim el criteri següent:
f(input) = output
I el problema invers, si ens donen una funció i volem saber la matriu equivalent? Treballem ara amb un exemple en 3D. Ens donen la funció
Veiem que aquesta màquina menja vectors 3D i produeix vectors també 3D. Aquest detall és important, perquè pot menjar i produir vectors de diferent dimensionalitat! Però ara ens interessa trobar la matriu M associada a f (és a dir, que fa la mateixa tasca com a màquina). Escrivim la següent equació, que ens ajudarà força:
Mirant aquesta equació, s'ha de veure a ull que necessitem que la matriu sigui
Per tant, la matriu buscada és